一、算数平均值
1、平均值的作用
平均数是表示一组数据集中趋势的量数,它是反映数据集中趋势的一项指标。一组数据少则几十,多则上千,甚至于过百万,“由于我们的思维不能思考所有的数据”,需要选取一个合适的代表值表达一组数据的特征。平均数便是小学阶段学习的一个重要的统计量。
2、算数平均值求法
- 样本:S = [s1, s2, s3, …, sn]
- 算术平均值:m = (s1 + s2 + s3 + … + sn)/n
3、Numpy中的格式
m = numpy.mean(样本数组)
4、练习代码
import numpy as np
# 解包取出收盘价
closing_prices = np.loadtxt(
'0=数据源/beer_price.csv', delimiter=',',
usecols=(4), unpack=True,
)
# 手动计算平均值
mean1 = 0
for closing_price in closing_prices:
mean1 += closing_price
mean1 /= closing_prices.size # 除个数
print(mean1)
# numpy的mean来计算
mean2 = np.mean(closing_prices)
print(mean2)
二、加权平均值
1、引入
- 求平均值的每个样本数据,可能具有不同的重要程度,有些极端值重要程度显然就很低,就这样每个样本数据的重要程度就表示它的权重
- 普通的算术平均数的权重相等,都是1,(比如,3和5的平均数为4