pandas数据分析常用的统计学方法和函数总结

最新推荐文章于 2024-07-25 23:19:30 发布

「已注销」

最新推荐文章于 2024-07-25 23:19:30 发布

阅读量1k

点赞数

文章标签：服务器

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_73291751/article/details/129897044

版权

Pandas 是 Python 中的一个数据处理库，提供了许多常用的统计学方法和函数，包括描述性统计、分组统计、相关性和协方差、回归和假设检验等。以下是一些常用的统计学方法和函数总结：

描述性统计

describe()：生成一份 DataFrame，其中包括针对数值数据列的统计信息，如均值、标准差、最小值、最大值等。

mean()：计算数据集的均值。

median()：计算数据集的中位数。

mode()：计算数据集的众数。

std()：计算数据集的标准差。

var()：计算数据集的方差。

count()：计算数据集的非缺失值的数量。

分组统计

groupby()：将数据集按照一个或多个列分组，并对每个分组应用一个或多个聚合函数。

sum()：对每个分组中的数据进行求和。

count()：对每个分组中的数据进行计数。

mean()：对每个分组中的数据进行均值计算。

median()：对每个分组中的数据进行中位数计算。

max()：对每个分组中的数据进行最大值计算。

min()：对每个分组中的数据进行最小值计算。

相关性和协方差

corr()：计算两个数据集之间的相关系数。

cov()：计算两个数据集之间的协方差。

回归和假设检验

regression()：拟合线性回归模型。

ttest_ind()：计算两个独立样本的 t 检验。

ttest_rel()：计算两个相关样本的 t 检验。

其他常用函数

isnull()：检测缺失值。

dropna()：删除包含缺失值的行或列。

fillna()：填充缺失值。

apply()：将一个函数应用于数据集的每个元素或每个列。

这些函数和方法只是 Pandas 提供的一小部分功能，具体使用方法和参数可以查看 Pandas 官方文档。

「已注销」

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
pandas数据分析常用的统计学方法和函数总结

groupby()：将数据集按照一个或多个列分组，并对每个分组应用一个或多个聚合函数。apply()：将一个函数应用于数据集的每个元素或每个列。median()：对每个分组中的数据进行中位数计算。mean()：对每个分组中的数据进行均值计算。max()：对每个分组中的数据进行最大值计算。min()：对每个分组中的数据进行最小值计算。count()：计算数据集的非缺失值的数量。count()：对每个分组中的数据进行计数。sum()：对每个分组中的数据进行求和。mean()：计算数据集的均值。
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。