结合实例总结pandas的部分常用函数

最新推荐文章于 2024-08-04 21:43:10 发布

zhuzuwei

最新推荐文章于 2024-08-04 21:43:10 发布

阅读量1w

点赞数 3

分类专栏： Python pandas 文章标签： python pandas

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zhuzuwei/article/details/78747736

版权

Python 同时被 2 个专栏收录

38 篇文章 10 订阅

订阅专栏

8 篇文章 2 订阅

订阅专栏

1. df.head（n）: 显示数据前n行，不指定n，df.head则会显示所有的行

2. df.columns.values获取所有列索引的名称

3. df.column_name: 直接获取列column_name的数据

4. pd.unique(Series)获取Series中元素的唯一值（即去掉重复的）

注意和nunique的区别，nunique只作用于Series,用法是Series.nunique()，返回Series中只出现过一次的元素，

5. max,min可直接作用于Series取最大和最小值

6. pd.value_counts(Series)统计Series中不同元素出现的次数

7. df.groupby和agg的使用

（1）变量grouped是一个DataFrameGroupBy对象，它实际上还没有进行任何计算,只是将数据进行了分组

（2）可以使用agg对分组好的数据进行处理，传入的参数为函数，返回一个标量结果。使用自定义的函数时应加引号。

下图的例子是对分组好的数据按每列求平均值。

（3）agg的参数可以传入多个函数

（4）还可以指定对不同的列使用不同的函数进行处理

8. df.index获取行索引

9. 使用条件筛选：下列例子中的三个条件criteria1表示fuelType1中的元素满足isin([])，criteria2表示fuelType2中的元素满足isnull(),

criteria3表示atvType中的元素不等于‘Hybrid’，vehicles_non_hybrid = vehicles[criteria1&criteria2&criteria3]表示vehicles_non_hybrid

是vehicles同时满足这三个条件筛选出来的数据。

10. pandas.DataFrame.reset_index(level=None, drop=False, inplace=False, col_level=0, col_fill='')

参见http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.reset_index.html

pandas.DataFrame.reset_index

关注

3
点赞
踩
16

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。