用python读取csv文件方法总结:
在用python读取csv文件时,常常产生各种错误,导致无法读取文件。
笔者这里总结了一些曾经使用过的读取csv文件的方式,打包成一个函数,作为一种搞不清编码问题→_→,暴力打开csv文件的方法。
def open_CSV_file(file_name):
import pandas as pd
import csv
try:
f=open(file_name,'r',encoding='utf-8') #此方法通常能打开全为数字的csv文件
data1=pd.read_csv(f,engine='python')
except Exception:
print('method1 died')
try:
csv_reader = csv.reader(open(file_name, encoding='utf-8'))
data2=pd.DataFrame(csv_reader)
except Exception:
print('method2 died')
try:
data3=pd.read_csv(file_name,encoding='gbk',header=None) #header参数还可修改为0,代表第0行作为columns名称
except Exception:
print('method3 died')
try:
csv_reader = csv.reader(open(file_name, encoding='gbk'))
data4=pd.DataFrame(csv_reader)
except Exception:
print('method4 died')
try:
data5=pd.read_csv(file_name,header=0,encoding='gbk',error_bad_lines=False)
except Exception:
print('method5 died')
try:
f=open(file_name,'r',encoding='ISO-8859-1')
data6=pd.read_csv(f,engine='python')
except Exception:
print('method6 died')
try:
f=open(file_name,'r',encoding='gb18030')
data7=pd.read_csv(f,engine='python')
except Exception:
print('method7 died')
#使用函数时,参数为文件名
open_CSV_file('06-22.csv')
拿一个csv文件试验了一下,方法4、5没有go die可以打开,分别读取为
data4、data5的dataframe形式。这个函数可以解决大部分遇到的csv文件读取问题。
欢迎补充和指正。