解决方式:
读文件时加上 quoting=csv.QUOTE_NONE
data = pd.read_csv(path + '/' + fn,quoting=csv.QUOTE_NONE)
quote方式为不引用。读的时候认为内容是不被默认引用符(")包围的。
相关知识点:
pandas.read_csv参数
quoting : int or csv.QUOTE_* instance, default 0
控制csv中的引号常量。
可选 QUOTE_MINIMAL (0), QUOTE_ALL (1), QUOTE_NONNUMERIC (2) ,QUOTE_NONE (3)
其他相似错误
1、pandas.errors.ParserError: Error tokenizing data. C error: Expected * fields in line *, saw *
解决:
方式a.读文件时候加入参数 error_bad_lines=False #加入参数
data= pd.read_csv(data_file, error_bad_lines=False)
读取csv文件,分隔符默认逗号,分析可知,读取的数据中某个格内包含两个字段,即值内可能包含两个逗号
方式b.将文件打开另存在数据集要求的格式,不要偷懒直接修改后缀。例如,excel转CSV,手动另存可以修正某一些格式,保证格式统一
其根本原因是,数据格式的不正确,导致读取时候无法正确读取,从文件内容格式方面着手解决