找了很多资料想要将自己数据集中相同id的行进行整合,(单纯数据合并):
例如数据:
id name review
1 mi good
1 mi great
2 k nice
2 k really
合并之后效果:
id name review
1 mi [good,great]
2 k [nice,really]
代码如下
import pandas as pd
import numpy as np
pd.set_option(‘display.width’,None)
pd.set_option(‘display.max_rows’,None)
pd.set_option(‘display.max_colwidth’,None)
#df = pd.read_csv(“name.csv”)
df[‘review’]=df[‘review’].astype(str) #这一步在pycharm中是必要的。
df1=df.groupby([“id”,“name”]).apply(lambda x:[’,’.join(x[‘review’])])
print(df1.head())
#df1.to_csv(“namee.csv”)
其中df1=df.groupby([“id”,“name”]).apply(lambda x:[’,’.join(x[‘review’])])中groupby()里面,如果只是id相同的合并,那么只需要写成groupby(“id”) 即可。
参考了很多资料,这里进行整合。