解决Pandas读取CSV错误 Error tokenizing data. C error: Expected * fields in line , saw

wwang314159

于 2024-08-14 17:04:17 发布

阅读量265

点赞数 3

文章标签： pandas python

本文链接：https://blog.csdn.net/wwang314159/article/details/141194777

版权

假设我们有这样一个csv文件：

col_1,col_2,col_3
1,2,3
4,5,6
7,8,9,10

这时候我们运行：

import pandas as pd
df=pd.read_csv('test.csv')
print(df)

会得到如下错误：

ParserError: Error tokenizing data. C error: Expected 3 fields in line 4, saw 4

原因就是最后一行的列数多了一列。

这时候如果你认为这一行是不好的数据，想要去除掉，可以用：

 df=pd.read_csv('test.csv',on_bad_lines='skip')

此时运行结果为：

   col_1  col_2  col_3
0      1      2      3
1      4      5      6

或者可以去除并同时提醒哪一行有问题：

df=pd.read_csv('test.csv',on_bad_lines='warn')

如果想要保留这一行的数据，那就需要修改header，只需要把csv文件修改为：

col_1,col_2,col_3,col_4
1,2,3
4,5,6
7,8,9,10

这时候header的列数和第三行的列数一样了，就可以正常print了：

   col_1  col_2  col_3  col_4
0      1      2      3    NaN
1      4      5      6    NaN
2      7      8      9   10.0

另外还可以用excel打开csv，然后直接点保存，这时候再print就会显示：

   col_1  col_2  col_3  Unnamed: 3
0      1      2      3         NaN
1      4      5      6         NaN
2      7      8      9        10.0

因为excel的保存把原来的csv文件变成了如下文件：

col_1,col_2,col_3,
1,2,3,
4,5,6,
7,8,9,10

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

wwang314159

关注关注

3
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

成功解决pandas.errors.ParserError: Error tokenizing data. C error: Expected 1 fields in line 48, saw 2

近期请国内外头部出版社可尽快私信博主！——心比天高，仗剑走天涯，保持热爱，奔赴向梦想！低调，谦虚，自律，反思，成长，还算是比较正能量的博主，公益免费传播……内心特别想在AI界做出一些可以推进历史进程影响力的东西(兴趣使然，有点小情怀，也有点使命感呀)…

05-16

1万+

成功解决pandas.errors.ParserError: Error tokenizing data. C error: Expected 1 fields in line 48, saw 2 目录解决问题解决思路解决方法解决问题 pandas.errors.ParserError: Error tokenizing data. C error: Expected 1 fields in line 48, saw 2 解决思路 ...

pandas.errors.ParserError: Error tokenizing data. C error: Expected 16 fields in line 3, saw 2386

热门推荐

水亦心的博客

03-31

10万+

报错信息用Python做数据处理时，报如下错误： pandas.errors.ParserError: Error tokenizing data. C error: Expected 3 fields in line 28, saw 4 错误原因首先我们先看一下报错： pandas.errors.ParserError: Error tokenizing data. C e...

pd.read_csv出现Error tokenizing data. C error: Expected 4097 fields in line 408, saw 4098解决方案

大屁孩的博客

07-17

4711

在使用pandas的read_csv方法的时候出现了如下错误： Error tokenizing data. C error: Expected 4097 fields in line 408, saw 4098 错误原因标记化数据时出错，数据的结构不正确，这个文件一行应该有4097个数据，但在第408行出现了4098个数据。解决方案事先处理好数据，让数据的结构统一；如果不能处理数据...

【pd.read_csv出现Error tokenizing data. C error: Expected 2 fields in line 80, saw 3错误】

guoguoguo1233的博客

05-10

347

刚开始出现错误以为是自己文件存储的问题，其实就是read_csv默认的存储方式是以逗号(,)读取。要明确自己的数据源是以什么方式存储的，这样就可以避免这样的错误了，第一次在csdn上记录，希望自己以后再接再厉！例如我的initial_te_la.csv在存储时，是以sep=‘\t‘进行划分的，但是read_csv是以默认逗号(,)进行读取。也就是说，在利用pd.read_csv读取文件时，规定sep形式。要明确自己的csv文件是以什么格式划分的。

Pandas读取CSV错误：Error tokenizing data. C error: Expected 1 fields in line **, saw **

fulin9452的博客

11-24

6万+

错误示例： Error tokenizing data. C error: Expected 1 fields in line 386, saw 2 原因：分隔符设置错误，尝试设置delimiter='\t' pd.read_csv(filename, header=0, delimiter="\t") 建议：检查是否在代码中修改默认的分隔符（sep），以及读取的CSV文件分隔符形式 ...

pycharm读取csv文件出现pandas.errors.ParserError:Error tokenizing data. C error:Expected 2 fields in line

m0_61059796的博客

05-30

913

原因是在读取文件时，该结果是通过自己更改后缀导致的，即使更改了后缀，但是保存类型依旧为xlsx类型，而不是csv类型。如要保存为csv形式需要在xlsx文件另存时选择csv后缀形式。csv文件不能是自己手动更改后缀实现，需要在另存excel文件时选择存为csv形式。

解决ParserError: Error tokenizing data. C error: Expected 10 fields in line 13, saw 12

菜鸟IT女

06-21

2782

报错来源代码如下： import pandas as pd pd.read_csv("data1.txt") 报错如下：原因及解决方式这个报错信息的大概含义就是，期待的是10个字段，但是在第13行，出现了12个字段。而我们需要的是所有的数据，所以就是用python原生的读取文件方式——上下文管理器，并且构造数据为：二维数组，其中每个元素就是单独的一行。代码如下： # 定义列表data data=[] # 打开data1.txt with open('data1.txt', 'r',enc

pandas.errors.ParserError: Error tokenizing data. C error: Expected 2 fields in line 33, saw 4

09-11

C error: Expected 2 fields in line 33, saw 4 这个错误通常是由于读取CSV文件时解析错误导致的。这个错误表示在第33行中，预期有2个字段，但实际上看到了4个字段。要解决这个问题，有几种方法可以尝试。方法一...

pandas.errors.ParserError: Error tokenizing data. C error: Expected 2 fields in line 7, saw 6

05-30

C error: Expected X fields in line Y, saw Z" 错误通常表示文件中的某些行包含的字段数与预期的字段数不同。在这种情况下，pandas 将无法解析该文件，并引发该错误。例如，"Expected 2 fields in line 7, saw 6...

报错pandas.errors.ParserError: Error tokenizing data. C error: Expected 3 fields in line 7, saw 4

weixin_43789661的博客

11-15

2146

原因：先看文件的扩展名，是xlsx的就用read_excel，如果是csv文件就用read_csv。如果明明是表格，你非要用csv读，就会出现这种报错。

pandas.read_csv遇到ParserError(‘Error tokenizing data. C error错误的根本原因

jbluxun的博客

12-05

435

这里要注意，根据函数的定义，sep在分隔符超过一个字符时，默认为正则表达式，会调用Python parsing engine解析。所以如果碰到上述问题，检测文件格式中是否存在分隔符冲突即可。网上有很多解决方法，但都没有触及根本，比如添加参数error_bad_lines=False, sep=’\t’，或者修改文件后缀等等，其原因都是错误的。根本原因其实就是格式错误，sep是使用csv.Sniffer嗅探器检测csv文件第一行得到的分隔符，包括，；

bug：pandas.errors.ParserError: Error tokenizing data. C error: EOF inside string starting at row 143

qq_59629101的博客

02-27

1077

使用Pandas库读取CSV文件报错。

python打开表格出现pandas.errors.ParserError: Error tokenizing data. C error:

smile_ai的博客

03-21

2323

csv文件默认的是以逗号为分隔符，但是中文中逗号的使用率很高，所以使用pandas写入csv时可以设置参数分割符号 sep=’\t’ ，即以tab为分隔符写入。那这样在后面读取csv进行数据处理时，一定记得加上一个参数delimiter： path = r"你的输入路径及文件" data = pd.read_csv(path,delimiter="\t") `` ...

pandas.errors.ParserError: Error tokenizing data. C error: Expected 31 fields in line 107943, saw 32

大鱼的博客

07-27

2320

利用pandas读取数据数据报错： File "pandas/_libs/parsers.pyx", line 876, in pandas._libs.parsers.TextReader.read File "pandas/_libs/parsers.pyx", line 891, in pandas._libs.parsers.TextReader._read_low_memory File "pandas/_libs/parsers.pyx", line 945, in pandas.

pandas read_csv 错误： pandas.parser.CParserError: Error tokenizing data. C error

leiting_imecas的博客

03-31

2万+

今天panda.read_csv时遇到以下错误： File "/root/anaconda2/lib/python2.7/site-packages/pandas/io/parsers.py", line 1213, in read data = self._reader.read(nrows) File "pandas/parser.pyx", line 766, in pandas

pandas.errors.ParserError: Error tokenizing data. C error: 的解决【实测成功】

weixin_41529093的博客

01-09

2万+

仅作为记录，大佬请跳过。用,error_bad_lines=False 背景博主在运行df = pd.read_csv('label.csv', encoding="utf-8")时，出现：pandas.errors.ParserError: Error tokenizing data. C error: Expected 3 fields in line 9, saw 19 解决将代码改为： df = pd.read_csv('label.csv', encoding="utf-8",error_

【Python】ParserError: Error tokenizing data. C error: Expected 13 fields in line 45, saw 23

Asher117的博客

04-17

3314

#执行语句报错如下 pd.read_csv(path) ParserError: Error tokenizing data. C error: Expected 13 fields in line 45, saw 23 解决方法： pd.read_csv(path, error_bad_lines=False)

Python 中 ParserError: Error Tokenizing Data C Error 错误

迹忆客

01-20

3804

如前所述，当您的 Python 程序解析 CSV 数据但遇到无效值、空值、未填充列等错误时，会发生 ParserError: Error tokenizing data. C error 错误。假设我们在 data.csv 文件中有这个数据，我们正在使用它在 pandas 的帮助下读取，尽管它有一个错误。

解决Pandas读取CSV错误 Error tokenizing data. C error: Expected * fields in line *, saw *

解决Pandas读取CSV错误 Error tokenizing data. C error: Expected * fields in line , saw