以下为个人课程学习笔记,主做日常积累,如有问题,感谢指正,推荐相关网站写的真不错pandas 教程 - 盖若本 pandas 中文教程从 0 开始掌握利用 pandas 做数据处理和数据分析。可作为 pandas 入门进阶课程、pandas 中文手册、用法大全,配有案例讲解和速查手册。https://www.gairuo.com/p/pandas-tutorial
1. 合并数据
(1)堆叠
堆叠就是简单的把两个表拼在一起,也被称为轴向连接、绑定或连接。依照连接轴方向,数据堆叠可分为横向堆叠和纵向堆叠。
横向堆叠是将两个表在x轴向连接在一起,使用concat函数;纵向堆叠是将两个表在y轴向连接在一起,使用concat函数;
pandas.concat |
objs 要堆叠的两个对象 |
axis 默认为 0 列堆叠即在y轴向拼接 axis = 1 行对齐 = 0 列队齐 |
|
join 表示其他轴向上的索引是inner(交集)内连接 还是 outer(并集)外连接,默认outer |
当两个表索引不完全相同时,内连接返回索引重叠部分,外连接返回索引的并集,缺值NaN。当表完全相同时,inner与outer是相同的,结果都是按照x或y轴拼接起来。
append方法也可以用于纵向合并,但是使用append方法实现纵向表堆叠有一个前提条件,那就是两张表列名需要完全一致。
df3.append(df4) |
other 要添加的新数据 |
(2)主键合并
主键合并是通过一个或多个键将两个数据集的行连接起来。
merge可以在合并过程中对数据集中的数据排序。
merge pd.merge(detail,order,left_on='or |