- 了解期望,从了解平均数开始
- 了解平均数,从平均数,众数,中位数/中值开始
- 概率论里的数学期望(加权平均数的一种),信息密度最高,为什么?因为E是 数值*概率,二维信息被压缩到一个数值: E 期望里来了,这个信息含量最高!
1 平均数,众数,中位数,中值等等
1.1 基础概念
- 平均数 (mean Value):一般平均数是指算术平均数,比如(a+b+c)/3
- 中位数/中值 (median): 将数据按升序/降序排列,处于最中间的那个数。
- 众数 (mode):一组数据里,出现次数最多的那个数。
1.2 这3个概念的特点比较
1.2.1 平均数
- 平均数= 总数之和/ 份数之和
- 加权平均数 = 加权总数之和 / 加权份数之和
- 平均数,是反映数据集中趋势的指标/量数,
- 所有数求和然后平均,平均值可能不是序列里的数
- 为啥天天有人吐槽平均数不准?尤其是平均工资?那是因为数据分布不均匀,导致平均值过于偏向数字大一端,无法反映多数单位(数量多)的情况。
- 所以,平均数得配合方差,标准差来看
1.2.2 中位数/中值
- 中值是处于第n/2中间位置那个数或那2个数之间,中位数可能不是序列里的数
- 总是可以反映数据序列,最中段的局部的情况
- 不容易受极端值影响
- 个数信息+位置信息
1.2.3 众数
- 出现次数最多的那个数,众数一定是序列里的数
- 个数信息+数量信息
1.2.4 信息含量比较
- 平均数的信息含量最高,为什么?因为平均数,包含了数列的和信息,个数信息。sum/count
- 中位数,众数,其实都只取了个数信息+位置信息/数量信息
- 这么说起来,
- 概率论里的数学期望(加权平均数的一种),信息密度最高,为什么?因为E是 数值*概率,二维信息被压缩到一个数值: E 期望里来了,这个信息含量最高!
2 各种平均数
平均值 /平均数(mean Value)
2.1 加权平均数,我觉得更像一种加权思想
- 我觉得加权平均数是一种思想
- 加权平均数可以套用刀上面的各种平均数上,比如 算术加权平均数,几何加权平均数等等,也就是所有的平均数算法,都可以套上加权思路
2.2 常见分类方法:
2.2.1 经典分类法:3种平均数
- 算术平均数:可认为是一种特殊的加权平均数,权重为1的加权平均数,容易受极端值影响
- 几何平均值 :更适合等比数列
- 调和平均值(倒数平均数) :反过来更容易受极小值影响。
2.2.2 特殊平均数
- 平方平均数,又名均方根,英文缩写为RMS,是指一组数据的平方的平均数的算术平方根
- 2次方的广义平均数的表达式,也可称为2次幂平均数
- 一般只适合正态分布
3 加权平均数思想
3.1 加权平均数公式
- 加权平均值即将各数值乘以相应的权数,然后加总求和得到总体值,再除以总的单位数。
- 算术平均数,也是一种特殊的加权平均数,权重=1
- 概率这种平均数,也就相当于加权平均数的思想?很相似,权重=p就可以
3.2 算术平均数 和期望公式,可以用加权平均值公式推导出来
x¯ = a*1+b*1+c*1/(1+1+1) =a+b+c /3
E= (a1*p1+a2*p2 + ..... + an*pn) / (p1+p2+... + pn) =a1*p1+a2*p2 + ..... + an*pn
3.3 加权平均例子
例子1
例子2
总结
加权平均数的算法1
- 不管加权是否
- 回到平均值的定义,如果是平均加权分数= 总加权分数/总权重数
- 这永远是最基础,最底层的思考方向
- 比如 加权分数 = 总分数 / 总权重
- 比如 加权价格 = 总价格 / 总数量
加权平均数算法2
- 要考虑要计算的,什么 加权平均数
- 比如是 分数平均数,那么分数就是核心变量,权重是参数
- 比如,如果是平均价格,那么价格是核心变量,数量就是参数
4 详细看各种平均数
4.1 算术平均数
- 算术平均数( arithmetic mean),又称均值,是统计学中最基本、最常用的一种平均指标,分为简单算术平均数、加权算术平均数。它主要适用于数值型数据,不适用于品质数据。根据表现形式的不同,算术平均数有不同的计算形式和计算公式。
- 算术平均数是加权平均数的一种特殊形式(特殊在各项的权重相等)。在实际问题中,当各项权重不相等时,计算平均数时就要采用加权平均数;当各项权相等时,计算平均数就要采用算术平均数。
- 算术平均数,不仅体现数字上的关系,而且体现将两个线段的和作为一个线段,再将其平均分为相等的两段;
4.2 几何平均数
4.2.1 几何平均数和算术平均数的区别
- 而几何平均数,这个也体现了一个几何关系。作一正方形,使其面积等于以a,b为长宽的矩形,则该正方形的边长即为a、b的几何平均数。
- 中国古代数学书中提到的矩形面积时往往用长宽的几何平均数来表示。
4.2.2 几何平均数
- 几何平均数是对各变量值的连乘积开项数次方根。求几何平均数的方法叫做几何平均法
- 如果总水平、总成果等于所有阶段、所有环节水平、成果的连乘积总和时,求各阶段、各环节的一般水平、一般成果,要使用几何平均法计算几何平均数,而不能使用算术平均法计算算术平均数
- 乘的关系,步骤的关系,用几何平均数?
- 加的关系,不同方法的关系,用算术平均数?
- 适合使用的情况:
- 比例,指数
- 发展速度
- 连续工作
- 后面的以前面的为基础的
- 适合等比数列?
4.2.3 用几何平均数算利率相关举例
- 复利
- F=A*(1+i)^n
- n是计息周期
- i是计息周期内的利率
- 因为利率相关的都是复利
- 复利公式是指数函数,反过来求利率,平均利率就得用 开方算法,才是对称得逆运算!
- 然后 开始收益=1
- 期末收益= 1*1.05^n1*1.03^n2*1.02^n3
- 利率就是,期末收益进行开方计算
- 平均利率的计算
- 用总体思路,回到最初
- 平均利率 = (期末收益 - 期初收益)/年份 ?! 这个是错误的 ?
- 反过来这个你肯定知道
- 期末收益 = 期初收益*(1+ 平均收益)^n 所以反推就是开方
4.3 调和平均数
- 调和平均数(harmonic mean)又称倒数平均数,是总体各统计变量倒数的算术平均数的倒数。调和平均数是平均数的一种。但统计调和平均数,与数学调和平均数不同,它是变量倒数的算术平均数的倒数。由于它是根据变量的倒数计算的,所以又称倒数平均数。调和平均数也有简单调和平均数和加权调和平均数两种
4.3.2 例题计算
假设,一段路去的过程速度为60,回来的过程速度为30,求平均速度
- 错误答案: 平均速度= (60+30)/2 =45
- 方法1:
- 从速度的原始定义出发平均速度=总距离/总时间 = S/t = 60*t1+30*t2/(t1+t2)
- 而因为距离相同,S1=S2=S/2 速度不同
- 所以 t2=2t1
- 所以 V-= 60*t1+30*2*t1/3t1=120t1/3t1=40
- 方法2
- 用加权平均的思路
- V- =(v1*t1+v2*t2)/(t1+t2)
- = ( v1*S/v1 + v2*S/v2) /(S/v1+S/v2)
- = ( S + S) /(S/v1+S/v2)
- = 2/(1/v1+1/v2)
- 推出了调和平均数公式
- 方法3
- 直接用调和平均数公式
- V- = 2/ (1/60+ 1/30)= 60*2/3=40
4.4 三者关系
- 算术平均数和调和平均数是平均指标的两种表现形式。算术平均数和调和平均数并非两类独立的平均数;算术平均数和调和平均数的数值之间并无直接关系,也不存在谁大谁小的问题;不能根据同一资料既计算算术平均数,又计算调和平均数,否则就是纯数字游戏,而非统计研究。
- 算术平均数、调和平均数、几何平均数是三种不同形式的平均数,分别有各自的应用条件。进行统计研究时,适宜采用算术平均数时就不能用调和平均数或几何平均数,适宜用调和平均数时,同样也不能采用其他两种平均数。但从数量关系来考虑,如果用同一资料(变量各值不相等)
- 计算以上三种平均数的结果是:算术平均数大于几何平均数,而几何平均数又大于调和平均数。当所有的变量值都相等时,则这三种平均数就相等
从上表可见:算术平均数>=几何平均数>=调和平均数
而且每种平均数确实有不同的适用情况和特点
- EXCEL都有对应的公式
- AVERAGE()
- GEOMEAN()
- HARMEAN()
参考文章
下面这个文章写的是真好,看了很清晰
https://blog.csdn.net/dongyu1703/article/details/88632965
几何平均数和调和平均数是什么?有什么作用?详细资料讨论_dongyu1703的博客-CSDN博客_几何平均数和调和平均数