GBK,Unicode,UTF-8编码的相互转换

说明:
1.在python2默认编码是ASCII, python3里默认是unicode。

2.unicode 分为 utf-32(4个字节),utf-16(2个字节),utf-8(1-4个字节), utf-16是现在最常用的unicode版本, 不过在文件里存的还是utf-8,因为utf-8省空间。

3.在py3中encode,在转码的同时还会把string 变成bytes类型,decode在解码的同时还会把bytes变回string。

GBK,UTF-8编码转换思路:
以Unicode为桥梁进行转换(见文末流程图)

示例代码:

# In Python2
msg = "GBK,UTF-8编码的转换"
msg_gb2312 = msg.decode("utf-8").encode("gb2312")
gb2312_to_gbk = msg_gb2312.decode("gbk").encode("gbk")

print(msg)
print(msg_gb2312)
print(gb2312_to_gbk)
# In Python3
msg = "GBK,UTF-8编码的转换"
# msg_gb2312 = msg.decode("utf-8").encode("gb2312")
msg_gb2312 = msg.encode("gb2312") # 默认就是unicode,不用再decode
gb2312_to_unicode = msg_gb2312.decode("gb2312")
gb2312_to_utf8 = msg_gb2312.decode("gb2312").encode("utf-8")

print(msg)
print(msg_gb2312)
print(gb2312_to_unicode)
print(gb2312_to_utf8)

trantes
推荐阅读:ASCII、GB2312、GBK、GB18030、Unicode、UTF-8、BIG5 编码详解(全网最全)

本文参考于:https://www.cnblogs.com/alex3714/articles/5717620.html

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值