有时候,我们需要完成一下工作,例如数据
小明 12岁
小明 地球人
小明 喜欢唱跳rap篮球
第一列数据我们需要去重,第二列数据需要合并
import pandas as pd
df = pd.read_excel('sample.xlsx')
df["列名1"] = df["列名1"].astype(str) #转成字符串
df["列名2”] = df["列名2"].astype(str)
df = df.groupby('列名1')['列名2'].apply(lambda x: ','.join(x)).reset_index()
df.to_csv('sample.txt', sep='\t', index=False)
这样我们就对第一列数据去重,第二列数据合并。第二列数据以,隔开。
小明 12岁,地球人,喜欢唱跳rap篮球