问题描述:
处理数据时,出现了bug,本来已经找小的文件测试过,按理说是没有问题的,不知道为什么会一直有这个错误。在网上找了解决方法,一直没有解决,直到看到了一篇文章,终于解决了问题。
File "pandas\_libs\parsers.pyx", line 847, in pandas._libs.parsers.TextReader.read
File "pandas\_libs\parsers.pyx", line 862, in pandas._libs.parsers.TextReader._read_low_memory
File "pandas\_libs\parsers.pyx", line 918, in pandas._libs.parsers.TextReader._read_rows
File "pandas\_libs\parsers.pyx", line 905, in pandas._libs.parsers.TextReader._tokenize_rows
File "pandas\_libs\parsers.pyx", line 2042, in pandas._libs.parsers.raise_parser_error
pandas.errors.ParserError: Error tokenizing data. C error: Expected 1 fields in line 38384, saw 2
原因分析:
主要是因为我懒,直接把三个.xlsx文件,直接改后缀名,变成了.csv文件,但其实是不可以的,两者还是有区别的。所以造成处理数据一直报错。
解决方案:
把.xlsx文件改成.csv文件时,不能直接改后缀名,要用另存为,改成csv文件。