我有一个.csv文件,它有数百行/列,看起来像这样(小例子,请参阅图片,我无法复制/粘贴空字节必须手动键入它们):9142,16.04000000,14.65000000
<0x00><0x00><0x00>
9143,16.19000000,14.65000000
在尝试使用pandas读取csv时,有少量包含空字节(“<;0x00>;”)的行给我带来了麻烦pd.read_csv文件. 在
当我运行命令时:
^{pr2}$
我得到以下错误:pandas.errors.ParserError: ("NULL byte detected. This byte cannot be processed in Python's native csv library at the moment, so please pass in engine='c' instead", 'occurred at index 16')
当我切换引擎时,我得到:TypeError: ('cannot unpack non-iterable NoneType object', 'occurred at index 16')
有没有办法完全忽略这些行使用pd.read_csv?在
我认为一个解决方法可能是打开文件并循环浏览它们,删除包含<;0x00>;的任何行(如果可以读取的话)?在
如有任何想法/建议,我们将不胜感激。在
编辑-尝试逐行读取文件,以查看是否可以删除这些行,但不确定如何实际捕获空字节(使用“<;0x00>;”obv不起作用:D)