![](https://img-blog.csdnimg.cn/20201014180756923.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
读书笔记
lx_simple
小小的天,有大大的梦想
展开
-
数据挖掘
学习笔记二 一、数据预处理 1、数据质量用准确性、完整性、一致性、时效性、可信性和可解释性定义。质量基于数据的应用目的评估。 2、数据预处理的主要步骤,即数据清理、数据集成、数据归约和数据变换。 3、数据清理例程试图填充缺失的值、光滑噪声并识别离群点、纠正数据中的不一致。 3.1 缺失值 3.1.1 忽略元组 当缺少类标记符号时通常这样做(假定挖掘任务涉及分类)。 3.1.2 ...原创 2018-04-03 22:13:15 · 596 阅读 · 0 评论 -
数据挖掘
学习笔记一 一、认识数据 1、数据对象与属性类型 数据集由数据对象组成。一个数据对象代表一个实体。 属性是一个数据字段,表示数据对像的一个特征。在文献中,术语“维”(dimension)一般用在数据仓库中,机器学习文献中更倾向于使用术语“特征”(feature),统计学家则更愿意使用术语“变量”(variable)。 1.1 标称属性 指一些符号或事物的名称 因为标称属性值并不具有...原创 2018-03-28 20:57:11 · 661 阅读 · 0 评论