DataFrame.drop_duplicates去重与mysql 去重的差异
python DataFrame.drop_duplicates 对于空格和大小写是敏感的。
mysql对字符串大小写和右侧空格是不敏感,会判断是相同的。
可以采用以下办法保证drop_duplicates的结果和mysql的结果一致性
c=b.drop_duplicates([‘company_name’])
c[‘company_name’]=c[‘company_name’].str.replace(’ ', ‘’)
c[‘company_name’]=c[‘company_name’].str.upper()
d=c.drop_duplicates([‘company_name’])