pandas.errors.ParserError: Error tokenizing data. C error: Expected 2 fields in line 113, saw 3

最新推荐文章于 2024-06-06 14:51:16 发布

开始King

最新推荐文章于 2024-06-06 14:51:16 发布

阅读量4.6k

点赞数 3

分类专栏：数据分析文章标签： pandas python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_52118763/article/details/126785323

版权

数据分析专栏收录该内容

17 篇文章 2 订阅

订阅专栏

今天read_csv处理一个csv文件出现了这个问题：期待一个分割出现了两个。初步估计可能是文件格式问题。
首先打开文件看一下

没有列名，接着往下看

也就是有的行有两列数据，有的有一列。用记事本打开看一下分隔符

果然是这样，前面pandas读入的时候都是一个分割符两列数据，这里突然两个分隔符变成三列了。

处理方法，根据你不同的任务有不同的处理方法
第一种就是如果你不想要这些有多余分割符的数据，那么就删除这些行,使用参数
error_bad_lines=False
第二种 这些数据你需要保留，那么你给这个表加上列名即可，
在这里插入图片描述选中有数据的单元格，然后筛选，那么你就知道，哪些列是有数据的，这里是五个绿色小三角，也就是说五列数据，加上参数name列名即可
names=[1,2,3,4,5]

df=pd.read_csv(r'D:\train_label.csv',header=None,names=[1,2,3,4,5],
               )

那么读入后的数据，没有的数据就会nan，有数据的就正常读入了

这个问题发生的原因就是没有列名，那么pandas读入时默认按照第一行的格式，前面都是两列，而后面出现了三列，四列，五列数据就会报错。而你直接读入时指定数据列就可以避免这个问题了

其实你还可以把分隔符改成不是，的其他，比如sep='\t',那么就把每行的所有的数据读入一个单元格，后期使用正则化以逗号分割

关注

3
点赞
踩
3

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

开始King CSDN认证博客专家 CSDN认证企业博客

码龄4年

大连海事大学

126: 原创

1万+: 周排名

1万+: 总排名

48万+: 访问

: 等级

2417: 积分

260: 粉丝

672: 获赞

224: 评论

2741: 收藏

私信

关注

热门文章

分类专栏

数据分析 17篇
机器学习 18篇
深度学习 16篇
笔记 21篇
数据结构 5篇
linux 5篇
c/c++ 5篇
算法 7篇
python 6篇
前端 6篇
java 1篇
数据库 1篇
网络安全
python爬虫 1篇

最新评论

Tensorflow2.0
ha_lydms: 博文作者真是一位出色的写手！这篇博文让我受益匪浅，语言简洁明了，逻辑严谨有序。作者不仅运用了丰富的例子和引文，为观点提供了充分的支持和验证，还以其独特的视角带给读者全新的思考。
生成式对抗网络
开始King: 图片转存失败我也没办法了，已经换了好几个图床了，想看的去下面这个地址看，图片可以正常加载 https://www.cnblogs.com/cork/p/18469977
csdn上传md，图片转存失败
开始King: 解决了，是smms图床的问题，图床换成gitee就没事了
pycharm远程连接服务器找不到文件
开始King: 同步文件的时候，鼠标点击项目主目录，然后再上传文件，就不会出现，文件没有更新的情况了
linux搭建深度学习平台
开始King: 需要注意一点，远程连接到服务器后，你就当做是在服务器上运行代码，所有的文件路径都写服务器上的绝对路径

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

开始King 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。