正常数据
异常数据
行末有多余的逗号、无用的字段之类的
逐行读取并删除
根据你的删除需求,自行调整参数。
# 读取 CSV 文件
csv_path = "D:/myProjects/PyCharmProject/pyProject/data/data.csv"
# 创建一个空列表,用于存储修复后的行数据
fixed_lines = []
# 逐行读取 CSV 文件,并修复每行数据
with open(csv_path, 'r') as file:
for line in file:
line_str = str(line) # 将行数据转换为字符串类型
# 检查行是否包含多余的逗号
if line_str.count(',') > 6:
# 找到第7个逗号的索引位置
index_of_seventh_comma = line_str.find(',',
line_str.find(',',
line_str.find(',',
line_str.find(',',
line_str.find(',',
line_str.find(',',
line_str.find(',') + 1) + 1) + 1) + 1) + 1) + 1)
# 删除第7个逗号及其之后的所有内容
fixed_line = line_str[:index_of_seventh_comma] + '\n'
# 添加修复后的行数据到列表中
fixed_lines.append(fixed_line)
else:
# 如果行数据没有问题,则直接添加到列表中
fixed_lines.append(line_str)
# 将修复后的行数据写入新的文件
fixed_csv_path = "D:/myProjects/PyCharmProject/pyProject/data/data_fixed.csv"
with open(fixed_csv_path, 'w') as file:
file.writelines(fixed_lines)
print("已生成修复后的 CSV 文件:", fixed_csv_path)