利用python进行统计分析

本文介绍了如何使用Python进行统计分析,包括创建DataFrame、计算均值、中位数、最大值和最小值,并展示了分箱操作,利用cut()函数将数据分组。
摘要由CSDN通过智能技术生成

通常我们拿到特征后学要分析打指标非常多,例如均值、最大值、最小值等等。
下面讲解一下统计分析,先用字典结构创建一个简单的DataFrame,既方便传输数据,还可以指定索引和列名

 

#随机生成一个5×3的矩阵,元素取值为100以内的整数
import numpy as np
a = np.random.randint(100,size=(5,3))
a

输出:

array([[72,  8, 93],
       [21, 62,  7],
       [69, 76, 19],
       [ 2, 86, 12],
       [11, 42, 91]])
df = pd.DataFrame(a, index=['a','b','c','d','e'], columns=['A','B','C'])
df

输出:

#此函数若不指定维度,默认对每列数据进行加操作,相当于df.sum(axis=0)
df.sum()

输出:

A    175
B    274
C    222
dtype: int64

                
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值