数据特征分析:统计分析


统计指标对定量数据进行统计描述,常从 集中趋势离中趋势两个方面进行分析,本文介绍几个简单的 集中趋势度量指标离中趋势度量指标

1.集中趋势度量(指一组数据向某一中心靠拢的倾向,核心在于寻找数据的代表值或中心值)

1.统计平均数(简单算数平均数、加权平均数)

data = pd.DataFrame({
   'value':np.random.randint(100,120,100),#随机数据
                    'f':abs(np.random.randn(100))}#权重
                   )
data['f'] = data['f']/data['f'].sum()#使得权重的和为1
print(data.head())
print('-----------')

#算术平均数
mean = data['value'].mean()
print('算数平均数:{:.2f}'.format(mean))

#加权平均数
mean_w = (data['value']*data['f']).sum()
print('加权平均数:{:.2f}'.format(mean_w))
   value         f
0    118  0.004926
1    107  0.012918
2    115  0.015071
3    109  0.006512
4    114  0.017473
-----------
算数平均数:110.58
加权平均数:109.36

2.位置平均数(众数、中位数)

m = data['value'].mode()#众数可能有多个值,mode方法输出的为Series
print('众数为:{}'.format(m
  • 1
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值