Pandas 合并多个Dataframe（merge,concat）

最新推荐文章于 2024-06-17 12:54:05 发布

dta0502

最新推荐文章于 2024-06-17 12:54:05 发布

阅读量9.2k

点赞数 3

分类专栏：数据分析文章标签： Pandas merge concat

数据分析专栏收录该内容

38 篇文章 8 订阅

订阅专栏

pd.merge()

在数据处理的时候经常会遇到多个表单的合并问题，比如一个表单有user_id和age这两个字段，另一个表单有user_id和sex这两个字段，要把这两个表合并成只有user_id、age、sex三个字段的表。

普通的拼接是做不到的，因为user_id每一行之间不是对应的。pandas中有个merge函数可以做到这个实用的功能。

df = pd.merge(df1, df2, how='left', on='user_id')

用法很简单，说一下后两个参数就可以了，how=""参数表示以哪个表的key为准，上面的how="left"表示以表df1为准，而key也就是on=""的参数

how="left"就是说，保留user_id字段的全部信息，不增加也不减少，但是拼接的时候只把df2表中的与df1中user_id字段交集的部分合并上就可以了，如果df2中出现了某个user_id在df1中没有出现，就抛弃掉这个样本不作处理。

如果要进行多key合并:

df = pd.merge(df1, df2, how='left', on=['user_id','sku_id'])

pd.concat()

但是如果想仅进行简单的“拼接”而不是合并呢，要使用concat函数：

df = pd.concat([df_user, dummies_sex, dummies_age, dummies_level], axis=1 )

这样可以保留这些表单的全部信息，参数axis=1表示列拼接，axis=0表示行拼接。

要保证每个表单的行数是相同的，并且每一行对应的key也是相同的，列拼接才变得有意义。

关注

3
点赞
踩
17

收藏

觉得还不错? 一键收藏
0
评论
Pandas 合并多个Dataframe（merge,concat）

pd.merge()在数据处理的时候经常会遇到多个表单的合并问题，比如一个表单有user_id和age这两个字段，另一个表单有user_id和sex这两个字段，要把这两个表合并成只有user_id、age、sex三个字段的表。普通的拼接是做不到的，因为user_id每一行之间不是对应的。pandas中有个merge函数可以做到这个实用的功能。df = pd.merge(df1, df2, h...
复制链接

扫一扫

专栏目录

dta0502 CSDN认证博客专家 CSDN认证企业博客

码龄8年

91: 原创

3万+: 周排名

176万+: 总排名

192万+: 访问

: 等级

1万+: 积分

209: 粉丝

707: 获赞

144: 评论

2072: 收藏

私信

关注

热门文章

分类专栏

机器学习 1篇
Python基础 29篇
Leetcode 14篇
数据结构 6篇
数据结构——Python实现 11篇
算法 2篇
Linux 15篇
深度学习 1篇
生活问题 12篇
爬虫 33篇
数据分析 38篇
统计 1篇
数据库 42篇
Python网络编程 2篇
Hexo 7篇
GitHub 8篇

最新评论

PDF文件的数字签名的破解
weixin_39338080: 方法一（耗时较短，要有wps VIP）： 1、Adobe Acrobat 打开-打开文档-Ctrl+Shift+S (逐页另存为pdf) 2、wps打开 -应用-WPS PDF转换-选择所有pdf-转图片型pdf 3、Adobe Acrobat 打开-合并-后缀纯图版pdf-合成完整pdf 方法二 1、Adobe Acrobat 打开-导出到-图像-png-设置分辨率236.22像素（每页单独另存为png格式图片） 2、Adobe Acrobat打开-合并-图片导入-合成pdf 这两个方法经过实践可以用。希望能帮到大家。
Ubuntu安装最新的Python 3.6版本
今日宜喝啤酒: 查询python版本的命令是 python3.6 --version
windows获取文件夹下所有文件名的方法
普通网友: 这个怎么用？
PDF文件的数字签名的破解
北河100: 有效。感谢作者！
Seaborn lineplot图例标题设置
m0_HCX: ax是什么？

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。