使用pycharm去掉表格中的重复数据
接下来几篇文章为复盘前段时间数据分析的随笔
如何用pycharm去掉表格中重复数据呢?
1、安装pycharm
详细安装及配置Python环境过程:
https://www.runoob.com/w3cnote/pycharm-windows-install.html
2、下载openpyxl,xlrd,pandas
2、运行代码
import pandas as pd
# 读取Excel中Sheet1中的数据
data = pd.DataFrame(pd.read_excel("1.xlsx", "Sheet1"))
# 查看读取数据内容
print(data)
# 查看是否有重复行
re_row = data.duplicated()
print(re_row)
# 查看去除重复行的数据
no_re_row = data.drop_duplicates()
print(no_re_row)
# 查看基于[物品]列去除重复行的数据
wp = data.drop_duplicates(['单价'])
print(wp)
# 将去除重复行的数据输出到excel表中
no_re_row.to_excel("过滤重复行.xlsx")
3、注意:务必把要读取的表格放在与Python代码同一个文件夹下,否则数据会读不到。如果想放在桌面上,也可以,不过需要修改表格路径,也可以指定修改之后的文件放置的位置。