第一周作业
@统计学(第七版)
数据整理与展示
本节梳理不同类型的数据如何处理、整理与展示。
数据预处理
在数据整理与展示之前要进行数据的预处理,预处理包括数据的审核、筛选和排序操作。
数据审核指从数据完整性与准确性两个方面进行审核,例如,检查数据是否有遗漏、有错误、有异常值,而针对这些情况如何处理,如发现异常值是保留、修改还是剔除。说到数据的剔除操作,这就涉及到数据的筛选。
数据筛选就是把符合标准的数据保留,不符合标准的数据进行剔除,而保留下来的数据可以简单地进行“数据摸底”,如数据排序。
数据排序就是对数据按照一定顺序排列,便于展示数据的特征和规律。不同类型的数据排序方式不同,常见的数值型数据排序有降序、升序,文本型数据按照首字母或拼音排序。
分类和顺序数据的整理与展示
对分类数据和顺序数据主要做分类处理,之后计算出每一类的频数、频率或比例、比率,同时选择适当的图形进行展示,以便对数据及特种功能有一个初步的了解。
数值型数据的整理与展示
对数值型数据主要做分组处理,即对原始数据按照某种标准划分成不同的组别。数据分组常用方法是组距分组,如果组距相等,则为等距分组;否则为不等距分组。
分类数据使用条形图展示,分组数据使用直方图展示,未分组数据使用箱线图和茎叶图展示,多变量使用雷达图展示,时间序列数据使用折线图展示。
TODO
区分条形图与直方图之间的差异。