【Python】记一次有趣的转码试验

本文回顾了一次Python转码试验,探讨了Unicode字符串如何通过encode和decode进行编码转换。在处理RPC接口返回的自动化脚本中,遇到转码问题。文章指出,Python中的字符串以Unicode编码,非Unicode字符串进行encode操作会引发错误。在尝试将包含非Unicode编码(如gbk)的dict转换为JSON时,`json.dump`会报错,但通过设置`ensure_ascii=False`可以避免此问题。若要将字典转为Unicode,直接使用decode方法即可。未设置参数的`json.dump`会默认转码,但格式可能不正确,手动转换更可靠。
摘要由CSDN通过智能技术生成

一、背景

之前写一个自动化脚本,处理RPC接口返回,一直被转码困扰,现在回忆起来,试着看下究竟。
Python中字符串以Unicode编码,支持多语言。
Unicode编码的字符串可以通过encode来编码成其他编码(如utf-8,gbk),通过decode来做对应的解码。

>>> u"测试"
u'\u6d4b\u8bd5'
>>> u"测试".encode("utf-8")
'\xe6\xb5\x8b\xe8\xaf\x95'
>>> u"测试".encode("gbk")
'\xb2\xe2\xca\xd4'

如果对非unicode编码的字符串做encode则会出现:

>>> u"测试".encode("utf-8").encode("gbk")
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
UnicodeDecodeError: 'ascii' codec can't decode byte 0xe6 in position 0: ordinal not in range(
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值