作者:阿南 整理:小五
如何在Pandas合并数据,大家肯定都不陌生。
作为一个初学者,我发现自己学了很多,却没有好好总结一下。正好看到一位大佬 Yong Cui 总结的文章,我就按照他的方法,给大家分享用于Pandas中合并数据的 5 个最常用的函数。这样大家以后就可以了解它们的差异,并正确使用它们了。
在文章开始之前,我们需要创建两个简单的 DataFrame 对象。
import pandas as pd
df0 = pd.DataFrame({"a": [1, 2, 3], "b": [4, 5, 6]})
df1 = pd.DataFrame({"c": [2, 3, 4], "d": [5, 6, 7]})
1、concat
concat 函数字面就是就是连接的意思,它可以帮我们横向或者纵向合并数据。
当你纵向合并数据时,需要将轴axis指定为0,这实际上也是默认值。
pd.concat([df0,
df1.rename(columns={"c": "a", "d": "b"})],
axis=0)
当你横向合并数据时,具体操作如下所示。
pd.concat([df0, df1], axis=1)
默认情况下,当我们横向合并数据(沿列)时,Pandas其实是按照索引来连接的。当两者的索引不相同时,就会用 NaN 填充不重叠的&