复古的论坛,抓取的结果,都会包含层主的评论,要想办法遍历将这些重复的评论给删了
数据有3列,{id、时间、评论},所以是选取第二列:data[2]
for i,x in enumerate(data[2]):
for a,y in enumerate(data[2][i+1:]):
if str(x) in str(y):
data.iloc[a+i+1,2]= data.iloc[a+i+1,2].replace(str(x),'')
复古的论坛,抓取的结果,都会包含层主的评论,要想办法遍历将这些重复的评论给删了
数据有3列,{id、时间、评论},所以是选取第二列:data[2]
for i,x in enumerate(data[2]):
for a,y in enumerate(data[2][i+1:]):
if str(x) in str(y):
data.iloc[a+i+1,2]= data.iloc[a+i+1,2].replace(str(x),'')