在pandas中读取csv文件时出错[CParserError:错误标记数据。C错误:捕获缓冲区溢出 - 可能是格式错误的输入文件

pandas.errors.ParserError: Error tokenizing data. C error: Buffer overflow caught - possible malformed input file.
解决方法:

(1)如果您使用python及其大文件,您可以使用 engine='python’如下,并应该可以工作。

df = pd.read_csv( file_, index_col=None, header=0, engine='python' )

(2)原因是pandas用作行终止符的数据中有一些回车符“\ r”或者“\ n”,这可能是这个错误可能出现的常见原因。解决方案是将readterminator =’\ n’添加到read_csv函数中,如下所示:

df_clean = pd.read_csv('test_error.csv',
                 lineterminator='\n')
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值