数据挖掘
文章平均质量分 56
一梦醉千年
这个作者很懒,什么都没留下…
展开
-
数据挖掘学习笔记(三)数据预处理
数据预处理一,数据质量 数据质量涉及:准确性;完整性;一致性;时效性;可信性;可解释性。二,数据预处理的任务 (1)数据清理1,缺失值 方法:忽略元组;人工填写缺失值;使用一个全局常量填充缺失值;使用属性的中心度量填充缺失值;使用与给定元组同一类的所有样本的属性均值或中位数;使用最可能的值填充。2,噪声数据 噪声是被测量的变量的随机误差或方差、 方法:原创 2013-09-08 18:23:12 · 1427 阅读 · 0 评论 -
数据挖掘算法学习之Apriori算法
频繁模式: 频繁出现在数据集中的模式 譬如,一个商场一天出售的商品(大米,油,等)是一个数据集。频繁模式是一个子序列,如牙膏和牙刷总是在一起出现,则课看做一个频繁模式。关联规则: 频繁模式可以使用关联规则表示,如: 牙刷=>牙膏 表示一个人买了牙刷后很可能买牙膏。频繁项集:原创 2013-09-28 20:19:04 · 1684 阅读 · 0 评论 -
数据挖掘学习笔记(一)引论
1,什么是数据挖掘 数据挖掘是从大量的数据中挖掘有趣的模式和知识的过程。2,什么是KDD KDD是数据中的知识发现,包含以下过程: 数据清理;数据集成;数据选择;数据变换;数据挖掘;模式评估;知识表现。3,数据挖掘中的数据 (1)数据库数据 主要是关系数据库中的数据,关系数据库是表的集合,每个表都包含原创 2013-09-06 19:50:26 · 796 阅读 · 0 评论 -
复杂网络挖掘算法流水记录
复杂网络中的社团挖掘算法可以划分到原创 2014-05-02 18:17:19 · 1093 阅读 · 1 评论