python utf8 解码_Python urllib.request和utf8解码问题

在命令行打印时,会将Unicode字符串打印到终端。终端有一个编码,所以Python将您的Unicode字符串编码为该编码。这样就行了。

当你在CGI中使用它时,你最终会打印到stdout,它没有编码。因此,Python尝试用ASCII编码字符串。这将失败,因为ASCII不包含您试图打印的所有字符,所以您将得到上述错误。

解决方法是将字符串编码成某种编码(为什么不是UTF8?)在标题中也这么说。

所以像这样:sys.stdout.buffer.write(b"Content-type: text/html;encoding=UTF-8\n\n") # Not 100% sure about the spelling.

sys.stdout.buffer.write(site.encode('UTF8'))

在Python 2下,这也可以工作:print("Content-type: text/html;encoding=UTF-8\n\n") # Not 100% sure about the spelling.

print(site.encode('UTF8'))

但是在Python 3中,编码的数据是以字节为单位的,因此它不会很好地打印。

当然,您会注意到,您现在首先从UTF8解码,然后重新编码。严格地说,你不需要那么做。但是,如果您希望在两者之间修改HTML,那么最好这样做,并将所有修改保持为Unicode格式。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值