python描述统计代码_Python数据分析 | pandas汇总和计算描述统计

本文介绍了如何使用pandas进行聚合计算、描述统计、相关性与协方差的计算。通过示例展示了DataFrame的sum、mean、describe、corr、cov等方法的用法,并探讨了唯一值、值计数和成员资格的相关操作。
摘要由CSDN通过智能技术生成

7eaf2348f38e0158707d4a5f86b2e180.png

1. 聚合计算

pandas对象拥有一组常用的数学和统计方法。它们大部分都属于约简和汇总统计,用于从Series中提取单个值(如sum或mean)或从DataFrame的行或列中提取一个Series。跟对应的NumPy数组方法相比,它们都是基于没有缺失数据的假设而构建的。看一个简单的DataFrame:df = pd.DataFrame([[1.4, np.nan], [7.1, -4.5],

[np.nan, np.nan], [0.75, -1.3]],

index=['a', 'b', 'c', 'd'],

columns=['one', 'two'])

df

26fc0278f75bc308960a7acb6bc71464.png

调用DataFrame的sum方法将会返回一个含有列的和的Series:df.sum()  #默认axis=0/'index'

8e7514b15092e5b044d14452f55a68ff.png

传入axis='columns'或axis=1将会按行进行求和运算:df.sum(axis='columns') #axis=1

8b8db6e539e80206bbc20c21f8c4e51a.png

NA值会自动被排除,除非整个切片(这里指的是行或列)都是NA。通过skipna选项可以禁用该功能:print(df)

print("-----")

print(df.mean(axis='columns', skipna=False)) #axis=1

print("-----")

print(df.mean(axis='columns')) #axis=1 自动跳过na

bc44ee21be4c704a59a85b82b10da492.png

下表列出了这些约简方法的常用选项:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值