Python或者R语言出现中文字体乱码的情况

在用Python和RStudio加载上文链接提供下载的编程代码时,出现提示“Not all characters in E:/a.txt could be decoded using CP936."

cp936 的意思是 Codepage 936, 是简体中文的编码。

此外,中文字符集编码还包括:Unicode ,GB2312 ,GBK,GB18030,UTF-8等。

UTF-8的一个特别的好处是它与ISO- 8859-1完全兼容,可以表示世界上所有的字符,汉字通常用3个字节来表示。GB2312的code page是CP20936。
GBK的code page是CP936 。
GB18030支持的字符数更多。
GB2312、GBK、GB18030均为双字节。
当打开代码文件出现乱码时的解决方案:
在Python shell 开头加上:# -*- coding: utf-8 -*-
在RStudio中点击菜单栏File——>Reopen with Encoding...——>选择utf-8即可正常显示中文。


  • 6
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值