众数、平均数和中位数
一般不选众数为统计量,只有数据非常干净的时候众数才有价值。
当数据对称时,我们选择均值,做模型做预测,都是均值,参数估计选用均值,非参用中位数,描述性统计右偏时选中位数;一般不会出现左偏,如二八定律。
正太分布偏度 skewness = 0,右偏 skewness > 0,一般大于1右偏较严重,左偏 skewness < 0
分布
正太分布:人的身高,自然界的分布
对数正太分布(右偏最严重的):收入、利润,描述性统计就用中位数;建模,建立回归,神经网络等就对数据去对数 ln 即可
泊松分布:网页点击量,排队队伍长度等
伽玛分布:灾难造成的损失,损失的金额