CSV:删除每一行行末多余的逗号及其之后的所有内容

本文介绍了一个Python脚本,用于逐行读取CSV文件,检测并移除行末多余的逗号和其他无用字段,生成一个新的修复后的CSV文件。
摘要由CSDN通过智能技术生成

正常数据

在这里插入图片描述

异常数据

行末有多余的逗号、无用的字段之类的
在这里插入图片描述

逐行读取并删除

根据你的删除需求,自行调整参数。

# 读取 CSV 文件
csv_path = "D:/myProjects/PyCharmProject/pyProject/data/data.csv"
# 创建一个空列表,用于存储修复后的行数据
fixed_lines = []

# 逐行读取 CSV 文件,并修复每行数据
with open(csv_path, 'r') as file:
    for line in file:
        line_str = str(line)  # 将行数据转换为字符串类型
        # 检查行是否包含多余的逗号
        if line_str.count(',') > 6:
            # 找到第7个逗号的索引位置
            index_of_seventh_comma = line_str.find(',',
                                        line_str.find(',',
                                        line_str.find(',',
                                        line_str.find(',',
                                        line_str.find(',',
                                        line_str.find(',',
                                        line_str.find(',') + 1) + 1) + 1) + 1) + 1) + 1)

            # 删除第7个逗号及其之后的所有内容
            fixed_line = line_str[:index_of_seventh_comma] + '\n'

            # 添加修复后的行数据到列表中
            fixed_lines.append(fixed_line)
        else:
            # 如果行数据没有问题,则直接添加到列表中
            fixed_lines.append(line_str)

# 将修复后的行数据写入新的文件
fixed_csv_path = "D:/myProjects/PyCharmProject/pyProject/data/data_fixed.csv"
with open(fixed_csv_path, 'w') as file:
    file.writelines(fixed_lines)

print("已生成修复后的 CSV 文件:", fixed_csv_path)

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值