合理使用图表描述统计结果是应用统计的基本技能之一。
文章目录
数据的预处理
数据审核
检查原始数据raw data是否有错误,调查所得数据主要关注数据完整性、准确性。
二手数据着重审核数据的适用性、时效性。
数据筛选
找出符合特定条件的某类数据。
数据排序
按一定顺序将数据排列,以便研究者通过浏览数据发现一些明显的特征或趋势,找到解决问题的线索。
数据透视表
Excel中的pivot table工具,对数据表的重要信息按使用者的习惯或分析要求进行汇总和作图,形成一个符合需要的交叉表(列联表)
定性数据的整理与展示
定性数据包括分类数据和顺序数据。
分类数据的整理与图示
列出所分的类别,然后计算每一类别的频数、频率或比例、比率等,即可形成一张频数分布表,最后根据需要选择适当的图形进行展示。
数据的整理与计算
- 频数(frequency):落在某一特定类别或组中的数据个数。把各类别及落在其中的相应频数全部列出,并用表格形式表现出来,称为频数分布(frequency distribution)。
其中,两个或两个以上变量交叉分类的频数分布表也称为列联表(contingency table),二维的列联表(两个变量交叉分类)也称为交叉表(cross table) - 比例(proportion):也称构成比,指一个样本(或总体)中各个部分的数据与全部数据之比,通常用于反映样本(或总体)的构成或结构。
- 百分比(percentage):比例乘以100得到的数值,用%表示。
- 比率(ratio):样本(或总体)中不同类别数据之间的比值。由于比率不是部分与整体之间的对比关系,因此比值可能大于1.
比例与百分比注意区分,尤其是英文写作时。