数据的集中趋势描述:
寻找反映事物特征的数据集合的代表值或中心值。
算数平均值:最常用的数据集中趋势指标
(1)算数平均值:数据集合中所有数值的加和除以数值个数。
不足:当数据集合中出现异常值(极大值或极小值)时,算数平均值不适用。
例如:国家公布的人均年收入数据,一些极端的高收入人群拉高了算数平均值。
(2)几何平均值:
当数据之间不是加减关系而是乘除关系时使用。例如:银行的平均存款年利率、工厂每条生产线
上的平均产品合格率。
众数:数据集合中出现频率最高的数
适用:定类数据、以及数据可视化能划分为两组或以上时。
中位数:适用于在数据集合存在异常值的情况。
(有极大值,向右偏移;极小值,向左偏移)