数据分析(5)merge()、groupby()、索引相关操作

本文介绍了pandas库中merge()函数和groupby()操作,详细阐述了不同类型的合并方式,包括inner、outer、left和right。同时,探讨了如何根据指定列进行数据分组,以及如何利用index进行各种操作,如获取、设置和重置索引,以及处理复合索引。最后提到了level在复合索引中的作用和swaplevel()函数的用途。
摘要由CSDN通过智能技术生成

1、join:默认情况下他是把行索引相同的数据合并到一起。

merge:按照指定的列把数据按照一定的方式合并到一起。

通过merge函数合并两个DataFrame。on代表指明拿什么作为key来进行匹配。how这里分为left,right,inner,outer等方式。

t1.merge(t2,left_on="a",right_on="f",how="inner")

默认的合并方式inner,交集

merge outer,并集,NaN补全

merge left,左边为准,NaN补全

merge right,右边为准,NaN补全

2、在pandas中类似的分组的操作 df.groupby(by="columns_name")

grouped是一个DataFrameGroupBy对象,是可迭代的,grouped中的每一个元素是一个元组。

如果我们需要对国家和省份进行分组统计:

(1)grouped = df.groupby(by=[df["Country"],df["State/Province"]]) 这种情况df可以省略,因为Country和State/Province已经包含在df中。

获取分组之后的某一部分数据的计数:  

(2)df.groupby(by=["Country","State/Province"])["Country"].count()

对某几列数据进行分组计数

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值