python3编码得到中文_Python3的unicode编码转换成中文问题

最新推荐文章于 2024-07-06 02:49:40 发布

weixin_39950824

最新推荐文章于 2024-07-06 02:49:40 发布

阅读量227

点赞数

文章标签： python3编码得到中文

9102年，大部分人已经受尽了python2里面unicode的折磨，转向了python3。

python3似乎对一切的unicode都那么的友好，当一个字符串里存在unicode的时候，只要字符串是硬编码的，就可以转换成中文打印在控制台上，如：

s = ‘\u7b14\u8bb0’

print(s)

你得到的就是中文汉字。

但是，假如你。。的这段含有‘\u’的unicode编码不是硬编码进脚本的，而是通过requests在网上爬的。。。那么你会发现，你打印出来的，还是长这样的unicode编码，换句话说，解释器这个时候根本就没认出这东西原来是unicode编码，当成普通的字符序列了。

百度找到了最好的解决方法：在这个unicode串后面加上：

s = s.decode().encode(‘unicode_escape’)

print(s)

它就打印出汉字了

python3中没有这种问题，所以最简单的方法是引入__future__模块，把新版本的特性导入到当前版本

from __future__ import unicode_literals

print json.dumps(m,ensure_ascii=False)

=>{"a": "你好"}

在写入文件的时候出现了Python2.7的UnicodeEncodeError: ‘ascii’ codec can’t encode异常错误

大神的解决方法：

不使用open打开文件，而使用codecs：

from __future__ import unicode_literals

import codecs

fp = codecs.open('output.txt', 'a+', 'utf-8')

fp.write(json.dumps(m,ensure_ascii=False))

fp.close()

weixin_39950824

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python3编码得到中文_Python3的unicode编码转换成中文问题

9102年，大部分人已经受尽了python2里面unicode的折磨，转向了python3。python3似乎对一切的unicode都那么的友好，当一个字符串里存在unicode的时候，只要字符串是硬编码的，就可以转换成中文打印在控制台上，如：s = ‘\u7b14\u8bb0’print(s)你得到的就是中文汉字。但是，假如你。。的这段含有‘\u’的unicode编码不是硬编码进脚本的，而是通过...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。