在使用df进行:
df.dropna(subset=['keyword'])
df.drop_duplicates(subset=['keyword'])
报错:
'subset' not working for drop_duplicates pandas dataframe
或者
dropna() got an unexpected keyword argument 'subset'
是因为 在此之前df经过了apply函数操作,使得df数据不再是dataframe结构,而是变成了Series数据结构。
如下:
def d(x):
s = x['keyword'][0]
a = ['1','2']
if s not in a:
return x
else:
return None
sort_data = sort_data.apply(lambda x: d(x), axis=1)
sort_data = sort_data.dropna(subset=['keyword'])
就会报错:dropna() got an unexpected keyword argument 'subset'
原因是在sort_data = sort_data.apply(lambda x: d(x), axis=1)
之后,sort_data就是pd.series结构了(至于为什么我也不知道,可能和df数据有关系)
所以为了防止这种情况,直接改用map进行df的列值修改。如下:
def d(x):
s = str(x[0])
if s not in a:
return x
else:
return None
sort_data['keyword'] = sort_data['keyword'].map(d)
sort_data = sort_data.dropna(subset=['keyword'])