pandas.read_csv() 出现乱码,几种总结的解决方法

 

在pycharm中都是乱码并且出现以下的问题:

下面我用三种方法解决

unicode解码错误:“utf-8”编解码器无法解码位置5的字节0xc7:无效的延续字节

原因:

Python版本:Python 3.6
pandas.read_csv() 报错 OSError: Initializing from file failed,一般由两种情况引起:一种是函数参数为路径而非文件名称,另一种是函数参数带有中文。

方法一:

而解决问题的有效办法:直接在后面加入指定编译器为python即可(engine='python'))。否则用utf8还是不行

df=pd.read_csv('shuju.csv',engine='python')

考了错误原因和pandas的源码,发现调用pandas的read_csv()方法时,默认使用C engine作为parser engine,而当文件名中含有中文的时候,用C engine在部分情况下就会出错。所以在调用read_csv()方法时指定engine为Python就可以解决问题了。
 

方法二:

 

对于第二种情况还有另外一种解决方法,就是使用open函数打开文件,再取访问里面的数据:

df=pd.read_csv(open('shuju.csv'))

方法三:

直接用notepad++打开文件转码即可

然后直接保存

  • 7
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
在使用pd.read_csv函数读取csv文件时,如果文件中包含中文字符,可能会导致输出乱码问题解决这个问题方法是在pd.read_csv函数中添加一个参数encoding='gbk',指明编码方式为gbk。例如:file = pd.read_csv(filename, encoding='gbk')。这样就可以正确输出中文字符了。\[1\] 另外,encoding参数还可以指定为其他字符集类型,如'utf-8'或'ISO-8859-1',具体根据实际情况而定。\[2\]同时,pd.read_csv函数可以读取文件路径、网页上的文件或文件对象,具体使用方法可以参考以下示例代码:\[3\] ```python # 文件路径读取 file_path = r"E:\VSCODE\2_numpy_pandas\pandas\Game_Data.csv" f_df = pd.read_csv(file_path, sep=",|:|;", engine="python", header=0, encoding='gbk') print(f_df) # 网页上的文件读取 f_df = pd.read_csv("http://localhost/data.csv") # 文件对象读取 f = open(r"E:\VSCODE\2_numpy_pandas\pandas\Game_Data.csv", encoding="gbk") f_df = pd.read_csv(f) ``` 通过以上方法,你可以正确读取包含中文字符的csv文件,并避免乱码问题的出现。 #### 引用[.reference_title] - *1* [python读csv文件中文乱码问题简单解决(附python遍历目录下csv文件并输出内容的代码)](https://blog.csdn.net/m0_49558200/article/details/124313663)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control_2,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* *3* [【Pandas总结】第二节 Pandas 的数据读取_pd.read_csv()的使用详解(非常全面,推荐收藏)](https://blog.csdn.net/weixin_47139649/article/details/126744842)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control_2,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值