数据挖掘的基础应用

数据挖掘的分析方法:

· 分类 (Classification)
· 估计(Estimation)
· 预测(Prediction)
· 相关性分组或关联规则(Affinity grouping or association rules)
· 聚类(Clustering)
· 复杂数据类型挖掘(Text, Web ,图形图像,视频,音频等)

数据挖掘的方法简介:

·分类 (Classification)
首先从数据中选出已经分好类的训练集,在该训练集上运用数据挖掘分类的技术,建立分类模型,对于没有分类的数据进行分类。
例子:
a. 信用卡申请者,分类为低、中、高风险
b. 故障诊断:中国宝钢集团与上海天律信息技术有限公司合作,采用数据挖掘技术对钢材生产的全流程进行质量监控和分析,构建故障地图,实时分析产品出现瑕疵的原因,有效提高了产品的优良率。
注意: 类的个数是确定的,预先定义好的

· 估计(Estimation)
估计与分类类似,不同之处在于,分类描述的是离散型变量的输出,而估值处理连续值的输出;分类
数据挖掘
的类别是确定数目的,估值的量是不确定的。
例子:
a. 根据购买模式,估计一个家庭的孩子个数
b. 根据购买模式,估计一个家庭的收入
c. 估计real estate的价值
一般来说,估值可以作为分类的前一步工作。给定一些输入数据,通过估值,得到未知的连续变量的值,然后,根据预先设定的阈值,进行分类。例如:银行对家庭贷款业务,运用估值,给各个客户记分(Score 0~1)。然后,根据阈值,将贷款级别分类。

· 预测(Prediction)
通常,预测是通过分类或估值起作用的,也就是说,通过分类或估值得出模型,该模型用于对未知变量的预言。从这种意义上说,预言其实没有必要分为一个单独的类。预言其目的是对未来未知变量的预测,这种预测是需要时间来验证的,即必须经过一定时间后,才知道预言准确性是多少。
· 相关性分组或关联规则(Affinity grouping or association rules)
决定哪些事情将一起发生。
例子:
a. 超市中客户在购买A的同时,经常会购买B,即A => B(关联规则)
b. 客户在购买A后,隔一段时间,会购买B (序列分析)

· 聚类(Clustering)
聚类是对记录分组,把相似的记录在一个聚集里。聚类和分类的区别是聚集不依赖于预先定义好的类,不需要训练集。
例子:
a. 一些特定症状的聚集可能预示了一个特定的疾病
b. 租VCD类型不相似的客户聚集,可能暗示成员属于不同的亚文化群
聚集通常作为数据挖掘的第一步。例如,”哪一种类的促销对客户响应最好?”,对于这一 类问题,首先对整个客户做聚集,将客户分组在各自的聚集里,然后对每个不同的聚集,回答问题,可能效果更好。
· 描述和可视化(Description and Visualization)
是对数据挖掘结果的表示方式。一般只是指数据可视化工具,包含报表工具和商业智能分析产品(BI)的统称。譬如通过Yonghong Z-Suite等工具进行数据的展现,分析,钻取,将数据挖掘的分析结果更形象,深刻的展现出来。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
数据挖掘在各行业的应用论文 数据仓库与数据挖掘.caj 空间数据挖掘技术.caj 数据仓库与数据挖掘技术及其在科技情报业的应用前景.caj 相关案件的数据挖掘.caj 数据挖掘技术.caj 一种实时过程控制中的数据挖掘算法研究.caj EIS 环境下的数据挖掘技术的研究.caj 数据挖掘及其工具的选择.caj 数据挖掘技术与中国商业银行业务发展策略.caj 数据挖掘工具DMTools的设计与实现.caj 数据仓库、数据挖掘在银行中的应用.caj 基于信息熵的地学空间数据挖掘模型.caj 数据挖掘及其在商业银行中的应用.caj 数据挖掘与决策支持系统.caj 数据仓库、数据集市和数据挖掘.caj 数据仓库与数据挖掘1.caj IDSS 中数据仓库和数据挖掘的研究与实现.caj 基于粗糙集理论的数据挖掘模型.caj 数据挖掘及其在 SXWG_EIS 中的应用.caj 数据挖掘——技术与应用综述.caj 挖掘转移规则一种新的数据挖掘技术.caj 以地物识别和分类为目标的高光谱数据挖掘.caj 数据挖掘与虚拟数据库.caj 数据挖掘与电力系统.caj 浅说数据挖掘.caj 带Rough算子的决策规则及数据挖掘中的软计算.caj 数据挖掘系统的一种实现策略.caj 信息检索中的数据挖掘技术.caj 红外光谱谱图库中的数据挖掘.caj 中介粗集及其在数据挖掘中的应用.caj 数据挖掘在音高变化规律学习中的应用.caj 数据挖掘技术在财经领域的应用.caj 知识发现和数据挖掘的研究.caj 数据仓库与数据挖掘技术浅谈.caj 用户访问模式数据挖掘的模型与算法研究.caj 数据仓库的建设与数据挖掘技术浅析.caj 分类特征规则的数据挖掘技术.caj 数据挖掘技术的主要方法及其发展方向.caj OLAP和数据挖掘技术在Web日志上的应用.caj 数据挖掘技术12.caj 数据挖掘技术初探.caj 探索式数据挖掘模型的讨论.caj 前向网络bp算法在数据挖掘中的运用.caj 数据挖掘在Internet信息导航系统中的应用研究.caj 数据挖掘技术123.caj 基于粗糙集(Rough set)的数据挖掘及其实现.caj 数据挖掘技术在建模、优化和故障诊断中的应用.caj FCC油品质量指标智能监测系统的数据挖掘与修正技术.caj 一种测试数据挖掘算法的数据源生成方法.caj 基于数据挖掘的类比推理技术在石油产品分析系统中的实现.caj 神经网络在数据挖掘中的应用研究.caj 数据挖掘方法的评述.caj 基于数据挖掘的类比推理技术在石油产品分析系统中的实现1.caj 一个面向电子商务的数据挖掘系统的设计与实现.caj 数据挖掘技术在煤与瓦斯突出预测中的应用研究.caj 基于数据抽取器实现数据挖掘.caj 基于数据挖掘的群决策模型.caj 基于数据挖掘的普通话韵律规则学习.caj 数据挖掘和知识发现的技术方法.caj 可视化数据挖掘技术及其应用.caj 神经网络数据挖掘方法中的数据准备问题.kdh 基于CORBA的数据挖掘工具KDD-DC.caj 基于高校人事信息库的数据挖掘研究.caj 数据挖掘管理系统.caj 电信网告警数据库中的数据挖掘.caj 数据挖掘原理、方法及其应用.caj 一种基于数据仓库的数据挖掘系统的结构框架.caj OLAP与数据挖掘一体化模型的分析与讨论.caj 一种新型数据分析技术——数据挖掘.caj aaa数据挖掘和数据仓库及其在电信业中的应用.caj 数据挖掘技术及其应用.caj 数据挖掘中概念树的标准、生成和实现.kdh XML与面向Web的数据挖掘技术.caj 数据挖掘和数据仓库及其在电信业中的应用.caj 数据挖掘技术及其在地学中的应用.caj 结合数据融合和数据挖掘的医疗监护报警.caj 基于多媒体数据库的数据挖掘系统原型.caj 数据挖掘技术1.caj 股票信息的数据挖掘.caj 多媒体数据挖掘的相关媒体特征库方法.caj 基于数据挖掘的深部采场岩爆知识的自动获取.caj 空间数据挖掘理论与方法的研究.caj 金融数据挖掘中的非线性相关跟踪技术(英文).caj 数据挖掘技术的一个应用模型.caj DNA中的数据挖掘和启动子识别.caj 数据仓库与数据挖掘12.caj 数据挖掘系统设计.caj 数据挖掘方法的研究.caj 用数据挖掘技术优选侧钻井井位.caj 关注政府上网后的数据挖掘.kdh 数据挖掘技术及其在电力系统中的应用.caj 目前数据挖掘算法的评价.caj 基于数据挖掘的地下硐室围岩稳定性判别.caj 基于属性分类的数据挖掘方法.caj 基于数据挖掘模型的高压输电线系统故障诊断.caj 用于建模、优化、故障诊断的数据挖掘技术.caj 格子机数据挖掘方法.caj 数据挖掘及其在电力系统中的应用.kdh 用于
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值