简单的使用pandas读取csv文件提示:
ParserError: Error tokenizing data. C error: Expected 20 fields in line 4, saw 21
查询原因,原来是源数据文档里每一行数据的元素个数不一致导致,源数据不规范,有的行有20条数据,有的是21条,导致出错,这里找到个方式,再 pandas.read_csv() 中使用 error_bad_lines=False 参数,但使用后继续报错:
后经过查询,原来是在新版 pandas 里,原参数 error_bad_lines=False 已经被 on_bad_lines 替代,可以使用 on_bad_lines =“skip”, 但这样会删掉很多行,还是有缺陷。