1 数据的预处理
数据审核:检查数据中是否有错误,主要从完整性和准确性两个方面。对二手数据,则着重适用性和时效性。
数据筛选:根据需要找出符合特定条件的某类数据。
数据排序:按一定顺序将数据排列
数据透视表
2 品质数据的整理与展示
对品质数据主要做分类整理,对数值型数据主要做分组整理。
1 分类数据的整理与展示
频数与频数分布
分类数据的图示
条形图
帕累托图:按各类别数据出现的频数多少排序后绘制的条形图
饼图
环形图:饼图的扩展,去掉中间的“洞”
2 顺序数据的整理与展示
以上方法也可使用
累计频率和累计频率
3 数值型数据的整理与展示
分类数据和顺序数据的方法均可使用
数据分组:单变量分组和组距分组。分组原则“上组限不在内”——直方图
原始数据——茎叶图、箱线图
时间序列数据——线图
多变量数据:散点图、气泡图、雷达图
茎叶图:由茎和叶组成,将数字分为两部分,高位数值作为树茎,而叶上只保留最后一个数字。
箱线图:五数概括
气泡图:可用于展示三个变量之间的关系。一个放在横轴,一个放在纵轴,第三个则用气泡的大小表示。
雷达图:也称蜘蛛图,是显示多个变量的常用图示方法。每个变量值的大小由半径上的点到圆心的距离表示,再将同一样本的值在P个坐标上的点连线。n多边形。