python读取csv文件忽略空值_如何跳过/忽略csv文件中的空字节pd.read_csv？

最新推荐文章于 2023-08-19 16:32:58 发布

勺子说

最新推荐文章于 2023-08-19 16:32:58 发布

阅读量2.7k

点赞数

文章标签： python读取csv文件忽略空值

本文链接：https://blog.csdn.net/weixin_33520952/article/details/112932870

版权

我有一个.csv文件，它有数百行/列，看起来像这样(小例子，请参阅图片，我无法复制/粘贴空字节必须手动键入它们)：9142,16.04000000,14.65000000

<0x00><0x00><0x00>

9143,16.19000000,14.65000000

在尝试使用pandas读取csv时，有少量包含空字节(“&lt；0x00&gt；”)的行给我带来了麻烦pd.read_csv文件. 在

当我运行命令时：

^{pr2}$

我得到以下错误：pandas.errors.ParserError: ("NULL byte detected. This byte cannot be processed in Python's native csv library at the moment, so please pass in engine='c' instead", 'occurred at index 16')

当我切换引擎时，我得到：TypeError: ('cannot unpack non-iterable NoneType object', 'occurred at index 16')

有没有办法完全忽略这些行使用pd.read_csv？在

我认为一个解决方法可能是打开文件并循环浏览它们，删除包含&lt；0x00&gt；的任何行(如果可以读取的话)？在

如有任何想法/建议，我们将不胜感激。在

编辑-尝试逐行读取文件，以查看是否可以删除这些行，但不确定如何实际捕获空字节(使用“&lt；0x00&gt；”obv不起作用：D)

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

勺子说

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

Pandas数据导入和导出：CSV、Excel、MySQL、JSON

小龙在线

10-26

906

【代码】Pandas数据导入和导出：CSV、Excel、MySQL SQL。

史上最全！用Pandas读取CSV，看这篇就够了

大数据

07-27

1万+

导读：pandas.read_csv接口用于读取CSV格式的数据文件，由于CSV文件使用非常频繁，功能强大，参数众多，因此在这里专门做详细介绍。作者：李庆辉来源：大数据DT（ID：hzda...

参与评论您还未登录，请先登录后发表或查看评论

pd.read_csv()忽略源文件索引

漫步量化

10-18

8849

如下图，直接读取csv文件，原csv文件中索引列没有名字，读入python后自动加了名字叫做unnamed: 0 源文件：读入python：问题：如何不读入索引列，或者读入时直接命名 read_csv默认文件没有行列索引关于列名 df = pd.read_csv('path', header= 0) # 表示首行作为列名 df = pd.read_csv('path', he...

python读取csv文件忽略空值_python-如何使用熊猫完全忽略csv中的空格

weixin_30806145的博客

01-14

1874

我正在尝试将.csv文件制作成既易于阅读又易于熊猫阅读的格式.这意味着列应该整齐地分开,以便您可以轻松识别每个值所属的列.问题是,用空格填充它会降低熊猫功能.到目前为止,我所拥有的是work ,roughness ,unstab ,corr_c_w ,u_star ,c_starus ,True ,True ,-0.39 ,0.35 ,-.99w...

read_csv 怎么忽略错误

weixin_35755562的博客

01-13

1026

pandas 的 read_csv 函数有一个参数 error_bad_lines，可以忽略错误。默认值为 False，如果将其设置为 True，则会忽略读取过程中出现的错误。例如： pd.read_csv("file.csv", error_bad_lines=True) 还可以使用参数 warn_bad_lines 控制是否打印警告，默认为True 例如： pd.read_csv("fil...

python处理csv中的空值方法

12-25

如下所示： # -*- coding: UTF-8 -*- import jieba.posseg import tensorflow as tf import pandas as pd import csv import math """ 1.必須獲取CSV文件夾（ID：文本） 2.返回(ID：分词后的文本) """ flags = tf.app.flags flags.DEFINE_string("train_file_address","D:/NLPWORD/cut_word_test/hzytest.csv","添加训练数据文件") flags.DEFINE_string("resu

Python学习笔记之：如何去除列表中的 None 值

qq_42902997的博客

08-29

6521

代码 lst = [1,2,3,None] # 方法1：常规使用一个新列表 new_lst = [] for i in lst: if i is not None: new_lst.append(i) print(new_lst) # 方法2：通过列表解析完成 new_lst_1 = [i for i in lst if i is not None] print(new_lst_1) # 方法3：通过 filter 函数来实现 new_lst_2 = list(filter(N

动手学数据分析

bu_shuo_zai_jian的博客

06-14

435

接下来10天里会在这里记录组队学习的历程——>day01 本人第一次撰写学习笔记，欢迎小伙伴们提出建议，感谢指导。大致了解了一下今天的学习任务，分为两部分：读取数据和了解数据。由于环境之前已经配置好了，所以对于导入numpy和pandas在这就不多说了。一、读取数据—read_csv(参数) 对于任务一：导入numpy和pandas有一个提示：记得运行这段代码。任务二：用相对路径和绝对路径读取数 1.相对路径相对路径比绝对路径简单，像学习文档中的数据已经放在同一目录下了，直接‘文件名.文件后

Python文件IO与异常处理

Java/Python大数据成长之路

08-19

575

1）自定义异常：自定义异常类继承基类Exception或子类RuntimeError等# __init__构造方法用于接收一些参数来设置异常信息，例如错误码、错误消息等# 重写__str__方法用于返回异常的描述信息，相当于Java的toString()方法return f"

pandas 读取csv跳过空格

mmiikkuu的博客

06-16

859

在 Pandas 中，使用read_csv() 方法从 CSV 文件中读取数据时，使用 skipinitialspace=True 参数来跳过初始空格。

pandas读取文件(read_csv)，跳过报错的行

HaohaoLiu_的博客

08-24

1万+

读取文件时遇到和列数不对应的行，此时会报错。若报错行可以忽略，则添加以下参数: 样式：pandas.read_csv(***,error_bad_lines=False)

【Python】【Pandas 】【read_csv()】Pandas库的read_csv()方法的使用，处理：None,NULL

望仔的博客

07-01

1310

对None的列进行处理，将空值转化成字符’',或是其他不影响的字符，再使用 dropna()，即可。

python用pd.read_csv读取csv文件报错,读取中文文件报错

weixin_48172266的博客

04-14

6005

23156

python分词读取CSV文件时报错

m0_59135228的博客

07-24

1368

写了一行这样的代码 df = pd.read_csv('景点评论/' + i, encoding='gb18030') 报错如下： Traceback (most recent call last): File "C:/Users/和静/Desktop/csvdata/analysis_wordcloud.py", line 54, in <module> df = pd.read_csv('景点评论/' + i, encoding='gb18030') File "D:...

pandas 处理数据的一些常见操作,统一处理数据文件中的各种空值

yangheng1的博客

08-16

672

我为一个使用pandas 的先手，在使用pandas 时总是出现各种问题，向大家分析一下。 1：首先是数据的读入 import pandas as pd score_df=pd.read_csv("./学生成绩单.csv") 当读入大量数据是需要分批读入，防止内存不够使用chunksize 来控制每次读入数据的行数 score_df=pd.read_csv("./学生成绩单.csv",chunksize=10000) 2：数据文件中空值的处理由于dataframe中的空值与python

python读取csv内容变为nan,python – 获取pandas.read_csv以空字符串而不是nan读取空值...

weixin_35403151的博客

03-26

1916

我正在使用熊猫库读取一些CSV数据。在我的数据中，某些列包含字符串。字符串“nan”是一个可能的值，空字符串也是这样。我设法让大熊猫读取“nan”作为一个字符串，但我不知道如何让它不读取一个空值作为NaN。这里是样本数据和输出One,Two,Threea,1,oneb,2,two,3,threed,4,nane,5,fivenan,6,g,7,seven>>> pandas.re...

ParserError: NULL byte detected. This byte cannot be processed in Python‘s native csv library

data+scenario+science+insight

10-30

2178

ParserError: NULL byte detected. This byte cannot be processed in Python's native csv library at the moment, so please pass in engine='c' instead 目录 ParserError: NULL byte detected. This byte cannot be processed in Python's native csv library at the mo

【Python】详解 Pandas 中的 read_csv()

Fanjufei的博客

05-26

4498

函数返回一个 DataFrame，其中包含了从 CSV 文件中读取到的数据。如果只需要读取文件中的一部分数据，可以使用参数。是 Pandas 中用于从 CSV 文件中读取数据的函数。，它表示要读取的 CSV 文件的路径或打开的文件对象。读取大型 CSV 文件时，可以使用参数。如果文件中有多个表格，则可以使用参数。其中，最常用的参数是。

pd.read_csv用法