通过数据集的描述事件、结构、维度含义和维度类型的确定,可以快速了解要分析数据的特征,为进一步的分析做准备。
目录
一 什么是数据
1 定义 指对客观世界的记录,是对客观事件的性质、状态以及相互关系等进行记载的符号或这些符号的组合。
2 数据的分类
- 定性数据——不可计算的
- 定量数据——可以计算的
- 定时数据 ——表示时间、日期的
二 认识数据集
1 定义 指数据对象的集合
数据对象可以称为 记录 或者 事件
2 数据集的结构
- 行——每一行是一个对象的记录,也叫做事件、样本、案例或者向量
- 列——每一列是对象的一个属性,也叫做对象的特征、数据集的字段或者维度
3 数据集的分类
- 定性 提供足够的信息以区分对象
处理方式——众数、分布分析
- 定量 对对象某些特征的统计数值
处理方式——均值、方差、标准差
- 定时 日期、时间的统计
处理方式——时间序列
三 什么是指标
1 定义<