当前位置: 主页 > 论文下载 > 工学论文 >

数据挖掘技术分析及其应用效果研究

作者:宋 伟 日期:2014-04-16 14:17 来源:中外企业文化
陕西广播电视大学 710068
【文章摘要】
随着信息技术的发展和互联网技
术的普及,现代信息系统已经进入了
大数据的时代。如何从大量的数据中
找到真正有价值的信息,成为急需解
决的问题。鉴于此,数据挖掘技术应
运而生。本文分析了数据挖掘技术的
定义和过程,并介绍了常用的数据挖
掘技术和对数据挖掘技术的应用进
行了介绍。
【关键词】
数据挖掘;分析;应用
数据挖掘是一个跨多学科和多个知
识领域的交叉的新兴课题,数据挖掘使人
们对数据的应用方式从简单的查询提升
至对数据挖掘行为的支持,数据挖掘涵盖
了模式识别领域、数据库领域、统计学领
域、可视化领域等多个领域,目前数据挖
掘技术已经成了新兴的研究技术热点。
1 数据挖掘的定义
数据挖掘准确的讲就是对大量的、杂
乱的数据进行分析处理,发现其中隐藏的
有用的信息,并为一些决策提供支持;从
数据挖掘的技术角度讲,数据挖掘技术就
是利用相关的技术和算法,从大量杂乱的
数据中找到人们需要的有用信息和知识,
知识可以以概念和模式、规则、规律等形
式表现出来,通过对数据的分析,可以找
到一些潜在的关系和模式,并协助预测未
来可能发生的情况和产生的结果。
2 数据挖掘的过程
在数据挖掘之前,先要确定数据挖掘
的目的,把问题和目标任务定义出来,确
定数据挖掘的目的之后,根据数据挖掘的
常规步骤开始挖掘知识信息,整个数据挖
掘的过程可以概括总结分为数据准备阶
段、数据挖掘阶段以及结果的解释和评价
阶段,数据准备阶段分为数据清理、集成、
选择和变换等过程。完整数据挖掘过程如
下图1 所示:
3 数据挖掘常用技术简介
数据挖掘技术有很多种,常用的有统
计技术、关联规则、基于历史的分析MBR
等,介绍如下:
3.1 统计技术
数据挖掘技术涉及到了多个学科领
域和技术,其中也涉及到了统计技术,统
计技术的应用主要是给数据聚合设定了
一个分部模型,然后采用与模型相适应的
方法进行数据挖掘。
3.2 关联规则
如果两个或者是多个变量的之间存
在某种规律性,这就可以称为关联,关联
分为简单、因果和时序关联。
3.3 基于历史的分析MBR
MBR 的主要概念就是用一些已知的
案例作为模型,通过这些模型,对新案例
进行估值和预测,MBR 分析中主要有距
离函数和结合函数两个因素,距离函数的
作用就是找出相似的相关案例,结合函数
数据挖掘技术分析及其
应用效果研究
宋 伟 陕西广播电视大学 710068
就是将这些相关的案例结合起来,在预测
的时候可以用到这些案例,这个方法有两
个优点,一是,能容许各种型态的数据,二
是,有学习的能力,可以从旧案例中获取
新知识。
3.4 遗传算法GA
遗传算法的主要思想是根据适者生
存的原则,新的群体由最适合规则和这些
规则的后代的这部分群体组成,一般情况
下,样本集分类的评估通过这些规则的适
合度来完成。
3.5 连接分析
连接分析的主要理论是图论,图论的
主题思想就是要寻找得出一个好结果的
算法,这种好的结果不是最完美的结果的
算法,如果这种不完美的结果是可行的,
这样的分析就是一个好分析,通过连接分
析,可以从用户的行为中分析总结出规律
性的模式,并将这种新的概念应用在广泛
的用户上。
3.6 决策树
决策树就是有着很强的解决归类和
预测的能力,它的表达方式是法则,这些
法则的展示是通过一连串的问题表现出
来,经过不断询问问题的过程,导出所需
要的结果,典型的决策树的底部有很多树
叶,其顶端是一个树根,它将记录分成很
多的子集,每个子集中包含一个简单的法
则,决策树有二元树、三元树等很多不同
的外型。
3.7 聚类分析
聚类分析涵盖的技术范围很广泛,很
多算法都有聚类分析这个功能如基因算
法、统计学中的群集分析、类神经网络等,
聚类分析的目标就是找出数据中以前所
不知道的相似群体,研究的开端一般都会
用到群集侦测技术。
3.8 神经网络(Neural Networks)
神经网络在结构上可以分为输入层、
输出层和隐含层,它是利用重复学习的方
法,在一串例子中进行归纳学习,然后归
纳出可以区分的样式,神经网络可以通过
对过去学习的成果进行归纳,推导出一些
新的例证的结果,神经网络的学习也属于
机器学习的一种,类神经学习的方式也可
以应用在数据挖掘的相关问题上。
3.9 回归分析
回归分析可以分为线性回归分析、非
线性回归分析、多元回归分析三种,线性
回归分析中采用数据采用直线建模的方
式,多元回归涉及到多个预测变量,是线
性回归的一种扩展方式,非线性回归模型
是在非线性回归的基本线性模型添加多
项式。
4 应用研究
数据挖掘技术能在大量的数据信息
中方便快捷的找到有用的信息,并将这些
信息充分利用。数据挖掘技术的应用可以
增强企业的竞争力,在缩短销售周期的基
础上降低了产品的生产成本,在信息资源
开发方面数据挖掘技术也有其明显的优
势,数据挖掘技术应用的行业越来越广泛
如保险、市场营销、制造业、教育、医疗和
电信业以及科学研究。
4.1 数据挖掘技术在制造业的应用
数据挖掘技术的在制造业中的应用,
主要是在生产的过程中,如果零部件出现
故障,可以通过数据挖掘技术对故障进行
详细的分析,发现故障产生的根本原因,
并及时纠正,及时发现分布不正常的数
据,只有这样才能帮助工程师及时发现问
题并采取正确的措施改进。
4.2 数据挖掘技术在市场营销的应

数据挖掘技术在市场营销上面应用
也很频繁和广泛,在这个领域中数据挖掘
技术可以分为货篮分析数据库和市场营
销数据库两种类型,货篮分析数据库的作
用就是分析营销的数据,市场营销数据库
就是利用自身的技术方法向顾客推销产
品,合理运用数据挖掘技术可以提高商家
的信誉并及时发现潜在的客户。
4.3 数据挖掘技术在科学研究的应

在科学研究的技术领域,数据挖掘
技术可以观测和分析大量的实验数据,由
于现在的科研数据很多,而且较为繁琐,
一些传统的数据分析方法不能满足科研
的需要,所以对一些强大的数据分析的智
能工具的需求力很强,这也在一定程度上
促进了数据挖掘技术的发展。在生物的科
研领域,实验室人员对DNA 的数据进行
分析,通常利用相似的检索技术和序列模
式,采用关联分析识别方法对同一时间出
现的基因序列进行识别分析,这样能够及
时发现每个阶段产生疾病的根本原因。
【参考文献】
[1] 杨永升. 基于数据挖掘的电信企
业客户关系管理研究[D]. 江苏科
技大学,2012.
[2] 赵一丁, 邵开丽, 李志民, 楚纪
正. 基于测试需求的数据挖掘及
测试数据生成[J]. 计算机测量与
控制,2013,08:2043-2045.
【作者简介】
宋伟,1984.10,男,西安人,本科,助
理工程师,研究方向:入侵检测,
数据挖掘

 


  博深论文网( www.bosslunwen.com ),是一个专门从事期刊推广、论文发表论文投稿指导的机构。本站提供整体论文发表解决方案:省级论文/国家级论文/核心论文/CN论文。
  论文投稿:bosslunwen@126.com
  咨询电话:18602588568
  在线咨询:
论文发表-论文投稿-发表论文86099078

版权所有:博深论文网 苏ICP备06011074号
论文投稿咨询电话:18602588568,在线咨询:论文发表-论文投稿-发表论文86099078,论文投稿:bosslunwen@126.com
本站点提供如下服务:论文发表 发表论文 论文投稿 职称论文发表 学术论文发表
山东省济南市城南路213号 本网站隶属于-济南富东化工有限公司