背景
有两个字段,想要将其合并成为一个新的字段。比如当标签分散在不同字段时候,想要将各个标签融合一起。
实现
def test():
import pdb
import pandas as pd
df = pd.DataFrame({'year': ['2019', '2020'], 'quarter': ['q1', 'q2']})
df['year_quarter'] = df['year'] + "_" + df['quarter'] # 方法1
df['year|year'] = df[['year', 'quarter']].agg('|'.join, axis=1) # 方法2
# 主要注意的是 如果存在 nan 数据怎么办. 先将其转为 str 类型。
# 比如 concate_df["year"] = concate_df["year"].astype(str)
df['year--year'] = df[['year', 'quarter']].apply(lambda x: '--'.join(x), axis=1)
df['year$year'] = df.year.str.cat(df.quarter, sep='$')