文章目录
统计指标对定量数据进行统计描述,常从 集中趋势和 离中趋势两个方面进行分析,本文介绍几个简单的 集中趋势度量指标与 离中趋势度量指标。
1.集中趋势度量(指一组数据向某一中心靠拢的倾向,核心在于寻找数据的代表值或中心值)
1.统计平均数(简单算数平均数、加权平均数)
data = pd.DataFrame({
'value':np.random.randint(100,120,100),#随机数据
'f':abs(np.random.randn(100))}#权重
)
data['f'] = data['f']/data['f'].sum()#使得权重的和为1
print(data.head())
print('-----------')
#算术平均数
mean = data['value'].mean()
print('算数平均数:{:.2f}'.format(mean))
#加权平均数
mean_w = (data['value']*data['f']).sum()
print('加权平均数:{:.2f}'.format(mean_w))
value f
0 118 0.004926
1 107 0.012918
2 115 0.015071
3 109 0.006512
4 114 0.017473
-----------
算数平均数:110.58
加权平均数:109.36
2.位置平均数(众数、中位数)
m = data['value'].mode()#众数可能有多个值,mode方法输出的为Series
print('众数为:{}'.format(m