pandas读取文件报错
读取csv文件报错OSError: Initializing from file failed
- 使用pandas读取csv文件的时候报错:OSError: Initializing from file failed,其原因是读取的文件名包含中文
- 根据文章参考得知,pandas的read_csv()方法,默认使用C engine作为parser engine,而当文件名中含有中文的时候,用C engine在部分情况下就会出错
- 参考文章链接:https://blog.csdn.net/qq_35318838/article/details/80564938
- 按照上面的方法尝试,设置engine=‘python’,用python引擎读默认是用gbk编码,设置文件对应编码’utf8’之后发现读取的数据存在问题,真实数据作为了index,并且由于文件太大内存溢出,此方法并不可取
- 换方法:将文件名修改成英文,engine使用默认引擎,设置文件对应的字符编码’utf8’,运行后数据解析正常,能拿到索引对应的值