数据挖掘
codingClaire
这个作者很懒,什么都没留下…
展开
-
《数据挖掘——概念与技术(第3版)》笔记(一)
【内容包括:第一章 引论】一、数据挖掘(数据中的知识发现 KDD)迭代序列:1.数据清洗 2.数据集成 3.数据选择 4.数据变换 5.数据挖掘 6.模式评估 7.知识表现二、挖掘数据的类型1.数据库数据 2. 数据仓库 3. 事务数据 4.其他类型三、挖掘的模式1.类/概念描述:特征化与区分2.频繁模式、关联和相关性3.用于预测分析的分类与回归...原创 2019-09-06 10:43:53 · 469 阅读 · 0 评论 -
《数据挖掘——概念与技术(第3版)》笔记(二)
【内容包括:第二章 认识数据】 目录一、数据对象与属性类型数据对象:一个实体,又称样本、实例、数据点或对象数据库的行对应于数据对象,列对应于属性属性: 一个数据字段,表示数据对象的一个特征(属性、维度、特征、变量)标称属性: 值式符号或事物的名称。每个值代表类别,编码或状态。标称属性也是分类的,枚举的。标称属性中数学运算没有意义。二元属性(布尔属性): 是一种标称属性,只有两个...原创 2019-09-06 11:05:17 · 1112 阅读 · 0 评论 -
《数据挖掘——概念与技术(第3版)》笔记(三)
【内容包括:第3章 数据预处理】目录一、数据预处理1.概述2.数据预处理的主要任务二、数据清理1.缺失值2.噪声数据3.数据清理1) 偏差检测2)数据变换三、数据集成1.实体识别问题2.冗余和相关分析标称数据的卡方检验数值数据的相关系数数值数据的协方差3.元组冲突4.数据值冲突的检测与处理四、数据归约1. 数据归约策略概述2. 小波变换3.主成分分析4.属性子集选择如何找出原属性的一个“好的”子...原创 2019-09-06 11:26:01 · 1922 阅读 · 0 评论