java csv 列长度,成功解决pandas.errors.ParserError: Error tokenizing data. C error: Expected 1 fields in lin...

最新推荐文章于 2024-05-16 15:39:03 发布

锦宁

最新推荐文章于 2024-05-16 15:39:03 发布

阅读量1.4k

点赞数

文章标签： java csv 列长度

问题描述：Traceback (most recent call last):

File "C:/Users/Lenovo/Desktop/水泥数据/dataprocess1.py", line 8, in

data1 = pd.read_csv("doubledata.xlsx")

File "D:\Users\Lenovo\miniconda3\lib\site-packages\pandas\io\parsers.py", line 676, in parser_f return _read(filepath_or_buffer, kwds)

File "D:\Users\Lenovo\miniconda3\lib\site-packages\pandas\io\parsers.py", line 454, in _read

data = parser.read(nrows)

File "D:\Users\Lenovo\miniconda3\lib\site-packages\pandas\io\parsers.py", line 1133, in read

ret = self._engine.read(nrows)

File "D:\Users\Lenovo\miniconda3\lib\site-packages\pandas\io\parsers.py", line 2037, in read

data = self._reader.read(nrows)

File "pandas\_libs\parsers.pyx", line 860, in pandas._libs.parsers.TextReader.read

File "pandas\_libs\parsers.pyx", line 875, in pandas._libs.parsers.TextReader._read_low_memory

File "pandas\_libs\parsers.pyx", line 929, in pandas._libs.parsers.TextReader._read_rows

File "pandas\_libs\parsers.pyx", line 916, in pandas._libs.parsers.TextReader._tokenize_rows

File "pandas\_libs\parsers.pyx", line 2071, in pandas._libs.parsers.raise_parser_error

pandas.errors.ParserError: Error tokenizing data. C error: Expected 1 fields in line 4, saw

报错在：pandas.errors.ParserError: Error tokenizing data. C error: Expected 1 fields in line 4, saw 21

源码位置：data1 = pd.read_csv("doubledata.xlsx")1

问题是：数据格式出错

解决方案：数据后缀转为.csv格式，只需打开转存的时候，改一下后缀即可。

添加参数：

data1 = pd.read_csv("doubledata.xlsx"，error_bad_lines=False)

看这个报错信息意思应该是：它是按照第0行的列长度来读取，然后后面某些行的列长度超出了就会出现报错，如上报错截图，需要210列，但是line4有281列，超出了。然后我百度后解决方法基本都是在read_csv()中添加error_bad_lines=False，但是这个只是把超出210列的行给删了。

但是我想保留所有数据，然后又进行长时间的查询，最后拼凑后形成如下解决方式：data=[]

with open('false8.csv', 'r',encoding='utf-8-sig') as f_input:

for line in f_input:

data.append(list(line.strip().split(',')))

datadataset=pd.DataFrame(data)

dataset

先将csv按行读取，按“，”分割形成2维数组，然后再转成dataframe型,结果如下：

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
java csv 列长度,成功解决pandas.errors.ParserError: Error tokenizing data. C error: Expected 1 fields in lin...

问题描述：Traceback (most recent call last):File "C:/Users/Lenovo/Desktop/水泥数据/dataprocess1.py", line 8, in data1 = pd.read_csv("doubledata.xlsx")File "D:\Users\Lenovo\miniconda3\lib\site-packages\pandas\i...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。