数据挖掘
枕霞
这个作者很懒,什么都没留下…
展开
-
数据挖掘
数据预处理主要任务数据清理(data cleaning)通过填写缺失的值,光滑噪声数据,识别或删除离群点,纠正数据中得不一致。缺失值忽略元组人工填写缺失值使用一个全局常量填充缺失值使用属性的中心度量(如均值或中位数)填充缺失值使用与给定元组属同一类的所有样本的属性均值或中位数使用最可能得值填充缺失值噪声噪声是被测量的变量的随机误差或方差。 数据集成(data integration)数原创 2015-09-29 00:29:56 · 456 阅读 · 0 评论 -
文章标题
挖掘频繁模式、关联和相关性:基本概念和方法基本概念频繁模式:是指频繁地出现在数据集中模式(如相集、子序列或子结构) 关联规则的支持度(support)反映发现规则的有用性。 规则A->B的支持度s=P(AUB) 即s是数据库中包含AUB的百分比。 规则原创 2015-11-11 23:09:44 · 470 阅读 · 0 评论