2.1 位置的度量
平均数、中位数、众数、百分位数、四分位数
mean,median,mode,IQR(inter-quartile range)
2.2 变异程度的度量
极差、四分位数间距、方差、标准差、标准差系数
2.3 分布形态、相对位置、异常值检测
偏度、Z-分数、切比雪夫定理、经验法则
切比雪夫定理描述与平均数相差某个特定个数的标准差的数据所占的比例。
异常值检测,与平均数相差+3或者-3个标准差以上的值就算异常值。经验法则依赖于正态分布。
2.5 探索性数据分析
五数概括法、箱线图
2.6 两变量间关系的度量
协方差,受变量单位的影响,因此有相关系数。
相关系数为1时,表示变量间存在斜率为正数的直线。越接近1越正相关,接近0表示不存在相关关系。
相关系数是对变量间相关而非因果关系的度量。
2.7 加权平均数、分组数据
加权数据表示了每个观测值的权重。
分组数据在计算相关的描述统计量时采用平均数即组中值代表分组数据的观测值。