CSV文件导入Python,遇到问题解决

#导入相应模块
# -*- coding: utf-8 -*-
import re
import os 
import pandas as pd
import numpy as np
import csv

#定义一个空列表  
data_list = []
file_in = "/Desktop/touzhiren/"
file_out = "/Desktop/tzrhz1126.csv"

for info in os.listdir(file_in): 
    domain = os.path.abspath(file_in)    #获取文件夹的路径 
    info = os.path.join(domain,info)    #将路径与文件名结合起来就是每个文件的完整路径  
    data = pd.read_csv(info,encoding="GBK")    
    data_list.append(data)
        
all_data = pd.concat(data_list)
all_data = all_data.drop_duplicates(["账务流水号"],keep="last")
all_data.tail()

# 将DataFrame存储为csv,index表示是否显示行名,default=True
all_data.to_csv(file_out,index=False,sep=',')
print("succesfully")

其中在data = pd.read_csv(info,encoding=“GBK”) 这里出现错误;总是显示"GBK"类型不对;
但是我昨天跑程序都没问题;
后来我用了 open(info,errors=“injoir”),虽然能够保证导入数据,但数据出现错误;
没办法,还是得在文件中寻找问题。
在 data = pd.read_csv(info,encoding=“GBK”) 下面一行加了1列 print(info),终于找到问题文件(2000多个CSV文件里面,夹杂了1个文本);
将文本提出来后,问题解决了;以后会吸取教训;

  • 3
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值