表格对齐函数pandas.datafram.align的参数“join”说明

场景:做数据分析的时候,我们经常需要对数据预处理后的训练集和测试集两个表格进行对齐。这时候我们可以用上pandas DataFram.align这个函数 。函数作用是返回列/行对齐后的两个表。但其文档https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.align.html 没有对参数"join"作进一步说明。以下用例子来说明该参数的作用:

先建两个表:

 (1) 设置join = "inner",axis = "1"(列对齐):

 可以看到,“inner”的对齐方式使将两个表格按列对齐后,列名只剩下两表列的交集(列B)并保持各自原先的数值

(2)设置 join = "outer",axis = "0"(行对齐)试试:

可以看到,“outer”的对齐方式让两个表格按行对齐后, 两个表格的行名为两个表行的并集(1,2,3,4),并且在原来表没有的数值位置上填上了NaN

(3) 设置oin = "left",axis = "None"(行/列都对齐)试试:

可以看到, “left”的对齐方式是让左边的表格(df1)的行和列名都保存下来,右边的表格(df2)行列对齐后也有这些列和行,并在原来没有数值的地方补上NaN

  • 3
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
pandas.concat是pandas库中一个用于连接(合并)多个数据框(DataFrame)的函数。它可以沿着指定的轴(默认为行轴)将多个数据框连接在一起,形成一个新的数据框。这个函数可以实现多种连接方式,包括按行或按列连接,连接时可以指定连接方式(内连接、外连接等)以及对缺失值的处理方式。pandas.concat的语法如下: ```python pandas.concat(objs, axis=0, join='outer', ignore_index=False) ``` 其中,objs是要连接的多个数据框(DataFrame)的列表或字典;axis是指定连接的轴,默认为行轴(axis=0);join是指定连接方式,默认为外连接(join='outer');ignore_index是是否忽略原始索引,默认为False。 pandas.joinpandas库中用于按照索引连接多个数据框的方法。它可以根据索引将多个数据框连接在一起,形成一个新的数据框。和pandas.concat不同,pandas.join只能按照索引进行连接,无法指定其他连接方式。pandas.join的语法如下: ```python DataFrame.join(other, on=None, how='left', lsuffix='', rsuffix='', sort=False) ``` 其中,DataFrame是要连接的数据框;other是要连接的其他数据框;on是指定连接的列名或列名列表,默认为None使用索引进行连接;how是指定连接方式,默认为左连接(how='left');lsuffix和rsuffix是指定用于重叠列的后缀,默认为空字符串;sort是指定是否根据连接键排序,默认为False。 pandas.merge是pandas库中一个类似于SQL的内连接操作,用于按照列进行连接多个数据框。它可以根据指定的列将多个数据框连接在一起,形成一个新的数据框。pandas.merge的语法如下: ```python pandas.merge(left, right, on=None, how='inner', sort=False) ``` 其中,left和right是要连接的两个数据框;on是指定连接的列名或列名列表,默认为None自动寻找重叠列进行连接;how是指定连接方式,默认为内连接(how='inner');sort是指定是否根据连接键排序,默认为False。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值