python 去除Excel中的重复行数据

最新推荐文章于 2023-10-19 15:36:45 发布

dbva7063

最新推荐文章于 2023-10-19 15:36:45 发布

阅读量5.1k

点赞数 4

文章标签： python

原文链接：http://www.cnblogs.com/loren880898/p/11303672.html

版权

导入pandas

import pandas as pd

1.读取excel中的数据；

frame = pd.DataFrame(pd.read_csv('excel的绝对路径.csv'’, 'Sheet1'))

2.去除重复行后的数据;

data = frame.drop_duplicates(subset=’’, keep='first', inplace=’’)

drop_duplicates用法：subset=‘需要去重复的列名’, keep=‘遇到重复的时保留第一个还是保留最后一个’, inplace=‘去除重复项，还是保留重复项的副本’

3.保存去重后的数据到excel;

data.to_excel('路径+名字.xlsx')

或者

data.to_csv(路径+名字.csv', encoding='utf8')

转载于:https://www.cnblogs.com/loren880898/p/11303672.html

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

关注关注