有时候文件会报错编码问题或者是像下面这样数据不规范导致的问题:
ParserError:Error tokenizing data.C error:Expected 2 fields in line 407,saw 3.
# 先通过open解决部分行有字节编码错误,errors='ignore'
with open('your.csv', encoding='utf-8',errors='ignore') as f:
# 再解决部分报错行如 ParserError:Error tokenizing data.C error:Expected 2 fields in line 407,saw 3.
dataset = pd.read_csv(f, error_bad_lines=False,,sep=',')
可以看到跳过了哪些行,因为什么原因跳过。