pandas.errors.ParserError: Error tokenizing data. C error: Buffer overflow caught - possible malformed input file.
解决方法:
(1)如果您使用python及其大文件,您可以使用 engine='python’如下,并应该可以工作。
df = pd.read_csv( file_, index_col=None, header=0, engine='python' )
(2)原因是pandas用作行终止符的数据中有一些回车符“\ r”或者“\ n”,这可能是这个错误可能出现的常见原因。解决方案是将readterminator =’\ n’添加到read_csv函数中,如下所示:
df_clean = pd.read_csv('test_error.csv',
lineterminator='\n')