1、描述
描述就是对事物或对象的直接描写,是对事物的客观印象。如果把描述概念对应到数据上,可以理解为这堆数据“长什么样”,通过对数据的描述能够让人感悟到数据的真实长相。统计学描述数据使用的指标通常是如下统计量:平均数、众数、中位数、方差、极差和四分位点,这些指标就好像是数据的“鼻子”“眼睛”“嘴唇”“眉毛”等。
- 平均数(average)
一般指算术平均数。就是一组数据的算术平均值,即全部数据累加除以数据个数的结果。
- 众数
数据集合中出现次数最多的数值称为众数。如果有两个或多个数值出现次数并列最多,那么这两个或多个数值都是该集合的众数。
例如:数据集合{2、3、8、6、3、5、3、2、6、3}中众数为3。
- 中位数
将数据集合中所有数据按照升序或降序排列,居于最中间的数值即为该集合的中位数,若集合中数值个数为奇数,取最中间一个为中位数,若集合中数值个数为偶数,取最中间两个数值的算术平均数为中位数。
例如:{2、5、6、9、13、15、20}中位数为9;{3、5、6、8、9、12、13、17}中位数为(8+9)/2=8.5。
均值、中位数和众数分布的关系如图
① 均值是观测值的重心:对称分布或接近对称分布时代表性较好。
② 中位数是观测值的中心:数据分布偏斜程度较大时代表性较好。
③ 众数是观测值的重点:偏斜程度较大且有明显峰值时代表性较好。
- 比例(proportion)和比率(ratio)
比例:表示总体中的某一部分数量占总体数量的比重, 反映总体的构成或者结构。一般用百分比的形式表示。
比率:表示总体中两个部分之间的比较,反应总体中各部分的关系,用几比几的形式表示。
例如:公司有50人,男生30人,女生20人,男生比例是30:50, 女生的比例是20:50,男生与女生的比率是30:20
- 同比(year-on-year)与环比(month-on-month)
同比:与历史同时期进行比较得到的数值。
例如:我公司今年一季度A产品销售额同比增加35%,意思是今年一季度A产品销售额比去年一季度A产品销售额增加35%,这是同比。
环比:与前一个统计期进行比较得到的数值。可以是