数据挖掘

1.数据挖掘的建模过程
(1)定义挖掘目标—–根据具体的数据挖掘应用需求,明确本次的挖掘目标,系统完成后能达到什么样的效果。需要分析应用领域,其背景、情况及各种相关知识。
(2)数据取样—-从业务系统中抽取与挖掘目标相关的样本数据子集(相关性、可靠性、有效性)
(3)数据探索—–对抽取的样本数据进行探索、审核和必要的加工处理。
主要包括:异常值分析、缺失值分析、相关分析、周期性分析等。
数据质量分析
1.缺失值分析—主要包括记录的缺失和记录中某个字段信息的缺失。<缺失值产生的原因、影响、分析>通过简单的统计分析,获取缺失值属性个数及每个属性的缺失数、未缺失数和缺失率。
对于缺失值的处理:删除缺失值存在的记录、对可能值进行插补、不处理三种情况。
2.异常值分析—样本中的个别值(离群点)
(4)数据预处理—–解决采样数据维度过大时的降维处理、缺失值处理。采样数据中常常包含许多噪声、不完整甚至不一致的数据,采用数据预处理改善数据质量。
主要包括:数据筛选、数据变量转换、缺失值处理、坏数据处理、数据标准化、主成分分析、属性选择、数据规约等。
(5)挖掘建模—分析建模所属的类别–(分类、聚类、关联规则、时序模式或是智能推荐),并选择模型构建所需的算法。
(6)模型评价—-从建模过程中会得到一系列的分析结果,选取最好的模型,另外根据业务对模型进行解释和应用。

作者:依然在原点
来源:CSDN
原文:https://blog.csdn.net/u010004460/article/details/51207060
版权声明:本文为博主原创文章,转载请附上博文链接!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值