python批量删除重复行并重命名文件

最新推荐文章于 2024-08-14 12:00:04 发布

Whao_5

最新推荐文章于 2024-08-14 12:00:04 发布

阅读量153

点赞数

分类专栏：笔记

本文链接：https://blog.csdn.net/Whao_5/article/details/120793956

版权

python

笔记专栏收录该内容

2 篇文章 0 订阅

订阅专栏

代码需求

对比csv文件前4列，重复的仅保留一行
对处理完的csv文件按照规范重新命名

code

# -*- coding：utf-8 -*-
# --------------------------------
# @Time     : 2021/10/15 22:41
# @Author   : HaoWu
# @File     : rmsame.py
# --------------------------------

import os
import re
import pandas as pd

def test():
    path='./nor'
    namelis = os.listdir(path)
    for name in namelis:
        df = pd.read_csv('{path}/{name}'.format(path=path, name=name))
        df = df.drop_duplicates(subset=['1', '2', '3', '4'], keep='first')  # 1 2 3 4表示前四列名称
        namepre = name[:-4]
        namepre = re.sub('\正常.txt', 'nor', namepre) # 文件名正则化，将文件名中正常.txt替换为nor
        namepre = re.sub('\.', '_', namepre) # 文件名正则化，将文件名中所有"."换成"_"
        name1 = namepre + '.csv'
        df.to_csv('{path}/{name}'.format(path=path, name=name1), index=False)

test()

Whao_5

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python批量删除重复行并重命名文件

代码需求对比csv文件前4列，重复的仅保留一行对处理完的csv文件按照规范重新命名code# -*- coding：utf-8 -*-# --------------------------------# @Time : 2021/10/15 22:41# @Author : HaoWu# @File : rmsame.py# --------------------------------import osimport reimport pandas as
复制链接

扫一扫

专栏目录