pandas使用drop_duplicates去除DataFrame重复项参数

最新推荐文章于 2023-09-25 14:45:52 发布

Laura_Wangzx

最新推荐文章于 2023-09-25 14:45:52 发布

阅读量1k

点赞数

分类专栏：机器学习与深度学习AI 文章标签： pandas 去除dataframe重复项参数

本文链接：https://blog.csdn.net/qq_37486501/article/details/86646972

版权

机器学习与深度学习AI 专栏收录该内容

52 篇文章 18 订阅

订阅专栏

pandas使用drop_duplicates去除DataFrame重复项参数

DataFrame中存在重复的行或者几行中某几列的值重复，这时候需要去掉重复行，示例如下：
data.drop_duplicates(subset=[‘A’,‘B’],keep=‘first’,inplace=True)

实例:

#保存至csv中
s=({"YYYY":Year,"State":data["State"],"TDRState":TDRState})
submit=pd.DataFrame(data=s)
submit=submit.drop_duplicates(subset=['State','TDRState','YYYY'],keep='first',inplace=False)
submit.to_csv('/Users/liyixin/Desktop/result.csv',index=False)