python描述统计代码_Python数据分析 | pandas汇总和计算描述统计

最新推荐文章于 2024-06-30 18:41:59 发布

weixin_39549899

最新推荐文章于 2024-06-30 18:41:59 发布

阅读量302

点赞数

文章标签： python描述统计代码

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39549899/article/details/114431839

版权

本文介绍了如何使用pandas进行聚合计算、描述统计、相关性与协方差的计算。通过示例展示了DataFrame的sum、mean、describe、corr、cov等方法的用法，并探讨了唯一值、值计数和成员资格的相关操作。

摘要由CSDN通过智能技术生成

1. 聚合计算

pandas对象拥有一组常用的数学和统计方法。它们大部分都属于约简和汇总统计，用于从Series中提取单个值(如sum或mean)或从DataFrame的行或列中提取一个Series。跟对应的NumPy数组方法相比，它们都是基于没有缺失数据的假设而构建的。看一个简单的DataFrame:df = pd.DataFrame([[1.4, np.nan], [7.1, -4.5],

[np.nan, np.nan], [0.75, -1.3]],

index=['a', 'b', 'c', 'd'],

columns=['one', 'two'])

df

调用DataFrame的sum方法将会返回一个含有列的和的Series:df.sum() #默认axis=0/'index'

传入axis='columns'或axis=1将会按行进行求和运算:df.sum(axis='columns') #axis=1

NA值会自动被排除，除非整个切片(这里指的是行或列)都是NA。通过skipna选项可以禁用该功能:print(df)

print("-----")

print(df.mean(axis='columns', skipna=False)) #axis=1

print("-----")

print(df.mean(axis='columns')) #axis=1 自动跳过na

下表列出了这些约简方法的常用选项：

最低0.47元/天解锁文章

weixin_39549899

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。