文章目录
第二章 认识数据与数据预处理
1.主要内容
一、认识数据
- 属性类型
- 数据的统计描述
- 相似性度量
二、数据预处理
- 为什么进行预处理数据?
- 数据预处理方法
2.基本概念
- 数据:对描述对象的抽象
- 数据集:数据对象的集合;
- 数据对象:实例 样本 矩阵中的一行 记录 点 向量 事件…
- 属性:用于刻画对象的基本性质或特征
——属性也称作:变量、特性、字段、特征、维
- 属性值:是赋予属性的数或符号
3.数据记录
3.1 数据矩阵
若数据对象具有固定个数的数值属性 那么我们把数据对象看做多维空间中的点 其中每维表示一个不同的属性。
——这种数据可以用一个m*n矩阵表示
其中m行——每行代表一个对象
n列——每列代表一个属性
3.2 文档数据
3.3 事物数据
eg:购物篮数据
4.有序数据——时间序列数据
比较好研究的一个小领域 发论文什么的也容易一些~
与神经网络结合起来了解
- 时间序列数据(time series data)