python utf8 解码_Python urllib.request和utf8解码问题

最新推荐文章于 2023-05-19 20:13:41 发布

weixin_39606003

最新推荐文章于 2023-05-19 20:13:41 发布

阅读量534

点赞数

文章标签： python utf8 解码

在命令行打印时，会将Unicode字符串打印到终端。终端有一个编码，所以Python将您的Unicode字符串编码为该编码。这样就行了。

当你在CGI中使用它时，你最终会打印到stdout，它没有编码。因此，Python尝试用ASCII编码字符串。这将失败，因为ASCII不包含您试图打印的所有字符，所以您将得到上述错误。

解决方法是将字符串编码成某种编码(为什么不是UTF8？)在标题中也这么说。

所以像这样：sys.stdout.buffer.write(b"Content-type: text/html;encoding=UTF-8\n\n") # Not 100% sure about the spelling.

sys.stdout.buffer.write(site.encode('UTF8'))

在Python 2下，这也可以工作：print("Content-type: text/html;encoding=UTF-8\n\n") # Not 100% sure about the spelling.

print(site.encode('UTF8'))

但是在Python 3中，编码的数据是以字节为单位的，因此它不会很好地打印。

当然，您会注意到，您现在首先从UTF8解码，然后重新编码。严格地说，你不需要那么做。但是，如果您希望在两者之间修改HTML，那么最好这样做，并将所有修改保持为Unicode格式。

weixin_39606003

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
python utf8 解码_Python urllib.request和utf8解码问题

在命令行打印时，会将Unicode字符串打印到终端。终端有一个编码，所以Python将您的Unicode字符串编码为该编码。这样就行了。当你在CGI中使用它时，你最终会打印到stdout，它没有编码。因此，Python尝试用ASCII编码字符串。这将失败，因为ASCII不包含您试图打印的所有字符，所以您将得到上述错误。解决方法是将字符串编码成某种编码(为什么不是UTF8？)在标题中也这么说。所以像...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。