Python入门题031：excel表格筛选重复数据

最新推荐文章于 2024-10-08 12:37:10 发布

写代码的安徒生

最新推荐文章于 2024-10-08 12:37:10 发布

阅读量3.1k

点赞数 2

分类专栏： Python入门100题文章标签： python

本文链接：https://blog.csdn.net/panyanyany/article/details/120431642

版权

Python入门100题专栏收录该内容

15 篇文章 2 订阅

订阅专栏

题目：

使用 pandas 筛选表格中的重复数据，将筛选后的表格保存到新的 excel 文件中。

视频教程：

Python入门题031：excel表格筛选重复数据

代码：

import pandas

scores = pandas.read\_excel('./storage/成绩单.xlsx')
print('------ 当前表格：')
print(scores)

print('------ 开始筛选重复数据：')

# 新建个 DataFrame 用来保存过滤后的数据
new\_scores = pandas.DataFrame()
# 用来标记是否已存在
existed\_name = {}
for index, row in scores.iterrows():
    if row\['姓名'\] in existed\_name:
        print('发现重复项：', row\['姓名'\], row\['成绩'\])
        continue
    existed\_name\[row\['姓名'\]\] = True
    new\_scores = new\_scores.append(row, ignore\_index=True)

print('------ 筛选后的表格：')
print(new\_scores)

print('------ 正在保存到新表格中')
new\_scores.to\_excel('./storage/成绩单-02.xlsx', index=False)
print('------ 完成！')