第二章 数据
数据类型
- 分类的(定性的):标称和序数
- 标称: 只能区分是否相同 ,当做符号一样 不参与数值运算。(=或者!=)例:邮政编码
- 序数:能确定对象的序,即大小关系。(<,<=,>,>=)例:矿石程度(好,较好,最好)
- 数值的(定量的):区间和比率
- 区间:可以进行差值比较。(+,-) 例:日历日期
- 比例:除了能进行差值比较还能进行比率比较 。 (*,/)例:长度
数据质量
引起数据质量降低的因素:
测量误差:记录的值与实际值不同 误差=测量值-实际值
数据收集错误:遗漏数据或者不当地包含了其他数据
数据收集错误:遗漏数据或者不当地包含了其他数据
噪声:测量误差的随机部分