统计学第一周学习笔记
一、数据的预处理:数据审核、筛选、排序
1.数据审核
概念:数据审核就是检查数据中是否有错误,主要是指对调查取得的原始数据进行完整性和准确性两个方面的审核。
完整性审核:检查调查的单位或个体是否有遗漏,所有的调查项目是否填写齐全。
准确性审核:检查数据是否有错误,是否存在异常值。
对于其他渠道获得的二手数据审核重点应在数据的实用性和实时性方面。
2.数据筛选
概念:数据筛选是根据需要找出符合特定条件的某类数据。
3.数据排序
概念:数据排序指按一定的顺序将数据排序
作用:①发现数据一些明显的特征或趋势;
②有助于对数据进行检查纠错;
③ 为重新归类或分组等提供方便
二、数据的整理与展示
数据经过预处理——审核、筛选、排序后,可根据数据对象的性质进一步做处理:品质型数据主要是做分类整理,数值型数据主要是做分组整理。
(一)品质数据的整理与图示
品质数据主要包含:分类数据和顺序数据
1分类数据的整理与图示:
分类数据的整理
整理方法:在整理时首先列出所分的类别,然后计算出每一类别的频数、频率或比例、比率等,形成一张频数分布表,并根据需求选择适当的图形进行展示
作用:对数据及其特征进行初步了解
分类