数据分析（5）merge()、groupby()、索引相关操作

最新推荐文章于 2024-04-02 14:08:04 发布

Kira_1899

最新推荐文章于 2024-04-02 14:08:04 发布

阅读量536

点赞数

文章标签： python pandas

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Kira_1899/article/details/118568705

版权

本文介绍了pandas库中merge()函数和groupby()操作，详细阐述了不同类型的合并方式，包括inner、outer、left和right。同时，探讨了如何根据指定列进行数据分组，以及如何利用index进行各种操作，如获取、设置和重置索引，以及处理复合索引。最后提到了level在复合索引中的作用和swaplevel()函数的用途。

摘要由CSDN通过智能技术生成

1、join:默认情况下他是把行索引相同的数据合并到一起。

merge:按照指定的列把数据按照一定的方式合并到一起。

通过merge函数合并两个DataFrame。on代表指明拿什么作为key来进行匹配。how这里分为left,right,inner,outer等方式。

t1.merge(t2,left_on="a",right_on="f",how="inner")

默认的合并方式inner，交集

merge outer，并集，NaN补全

merge left，左边为准，NaN补全

merge right，右边为准，NaN补全

2、在pandas中类似的分组的操作 df.groupby(by="columns_name")

grouped是一个DataFrameGroupBy对象，是可迭代的，grouped中的每一个元素是一个元组。

如果我们需要对国家和省份进行分组统计：

（1）grouped = df.groupby(by=[df["Country"],df["State/Province"]]) 这种情况df可以省略，因为Country和State/Province已经包含在df中。

获取分组之后的某一部分数据的计数：

（2）df.groupby(by=["Country","State/Province"])["Country"].count()

对某几列数据进行分组计数

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。