python去掉excel某列重复值,留下遇到的第一行

该文章介绍如何使用Python的pandas库来处理Excel文件,通过drop_duplicates函数删除重复行。在第一个例子中,通过指定凭证号列并设置first参数保留第一行,然后保存到新的Excel文件。第二个例子中,同样删除第三列重复的数据,但操作的是CSV文件。
摘要由CSDN通过智能技术生成

subset=['凭证号']   代表 表头 是凭证号这一列          keep='first'   代表留下遇到重复的第一行,inplace=Ture  代表删除所有重复行

import os
u='D:\\业务'
os.chdir(u)

f='副本管家婆凭证源文件.xls'
c='删除重复行后的文件.xlsx'
n='源格式'

import pandas as pd

# 读取Excel文件
a = pd.read_excel(f, sheet_name=n)

# 查找重复行
b = a.duplicated()

# 删除重复行
# a = a.drop_duplicates()

# 保存Excel文件
# a.to_excel(c, index=False)

data = a.drop_duplicates(subset=['凭证号'],keep='first',inplace=False)

data.to_excel(c,index=False)
方法二

subset=3  代表第三列

import pandas as pd
import csv
import xlwt,xlrd
l = list()
with xlrd.open_workbook(r'D:\yewu\student.xls') as read:
    sheet = read.sheet_by_name('Sheet1')
    for i in sheet:
        l.append(i)
df = pd.DataFrame(l)
df.drop_duplicates(subset=3,inplace=True)
df.to_csv('afterdel.csv')

  • 2
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值