使用pycharm去掉表格中的重复数据

本文介绍了如何在PyCharm中利用Python的数据分析库处理表格数据,去除重复项。首先,详细讲述了PyCharm的安装和Python环境配置,接着讲解了安装openpyxl, xlrd和pandas等库的步骤。最后,强调了运行代码时确保数据文件与Python脚本在同一目录下,或者正确修改文件路径的注意事项。" 106634317,8262980,JavaScript实现视频播放互斥,"['javascript', 'js']
摘要由CSDN通过智能技术生成

使用pycharm去掉表格中的重复数据

接下来几篇文章为复盘前段时间数据分析的随笔
如何用pycharm去掉表格中重复数据呢?
1、安装pycharm
详细安装及配置Python环境过程:
https://www.runoob.com/w3cnote/pycharm-windows-install.html
2、下载openpyxl,xlrd,pandas
在这里插入图片描述

在这里插入图片描述
2、运行代码

import pandas as pd

# 读取Excel中Sheet1中的数据
data = pd.DataFrame(pd.read_excel("1.xlsx", "Sheet1"))

# 查看读取数据内容
print(data)

# 查看是否有重复行
re_row = data.duplicated()
print(re_row)

# 查看去除重复行的数据
no_re_row = data.drop_duplicates()
print(no_re_row)

# 查看基于[物品]列去除重复行的数据
wp = data.drop_duplicates(['单价'])
print(wp)

# 将去除重复行的数据输出到excel表中
no_re_row.to_excel("过滤重复行.xlsx")

3、注意:务必把要读取的表格放在与Python代码同一个文件夹下,否则数据会读不到。如果想放在桌面上,也可以,不过需要修改表格路径,也可以指定修改之后的文件放置的位置。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值