pandas 如何用空格将两列数据拼接起来

菜鸟杜

于 2024-04-06 09:31:55 发布

阅读量526

点赞数 2

文章标签： pandas python 开发语言

本文链接：https://blog.csdn.net/chinacnd/article/details/137419174

版权

在处理数据的时候，有时需要将两列或多列数据进行拼接，其实方法还是挺多的。

第一种方法，直接使用+号，这是最容易也是最高效的方法。

import pandas as pd  
  
# 创建一个示例DataFrame  
df = pd.DataFrame({  
    'column1': ['apple', 'banana', 'cherry'],  
    'column2': ['red', 'yellow', 'pink']  
})  
  
# 使用字符串连接拼接两列  
df['combined'] = df['column1'] + ' ' + df['column2']  
  
print(df)

第二种方法使用使用apply和lambda函数

import pandas as pd  
  
# 创建一个示例DataFrame  
df = pd.DataFrame({  
    'column1': ['apple', 'banana', 'cherry'],  
    'column2': ['red', 'yellow', 'pink']  
})  
  
# 使用apply函数拼接两列  
df['combined'] = df.apply(lambda x: x['column1'] + ' ' + x['column2'], axis=1)  
  
print(df)

第三种方法是使用apply和join函数

import pandas as pd  
  
# 创建一个示例DataFrame  
df = pd.DataFrame({  
    'column1': ['apple', 'banana', 'cherry'],  
    'column2': ['red', 'yellow', 'pink']  
})  
  
# 使用apply方法结合join函数拼接两列  
df['combined'] = df.apply(lambda row: ' '.join([row['column1'], row['column2']]), axis=1)  
  
print(df)

apply()函数会遍历DataFrame的每一行，并且对于每一行，它都会使用join函数将column1和column2的值以空格分隔拼接起来，并将结果存储在新列combined中。

注意，这里的join函数是Python的内置字符串方法，用于将序列中的元素以指定的字符连接生成一个新的字符串。在这个场景下，我们使用了一个包含两个元素的列表[row['column1'], row['column2']]，并通过空格（' '）将它们连接起来。

然而，如果你想要一个更高效的方法，你应该避免使用apply()和lambda，而是直接使用Pandas的向量化字符串操作，即使用第一种方法。

这种方法通常比使用apply()更快，因为它在整个Series上进行操作，而不是逐行处理。