python2中的unicode_在python2中的编码

在python2中的编码

#_author:star

#date:2019/10/29

'''

字符编码:

ASCII:只能存英文和拉丁字符,

gb2312:只能6700中文,1980年

gbk1.0:存了20000多字符,1995年

gb18030:2000年,27000中文

unicode:UTF_32一个字符占4个字节

unicode:UTF_16一个字符占2个字节或两个以上,65535

unicode:UTF_8一个英文用ASCII来存,一个中文占3个字节

(1)在 python2 中UTF-8先解码到Unicode

然后Unicode在编码到GBK

(2)在 python2 中GBK先解码到Unicode

然后Unicode在编码到UTF—8

(3)在 python3中的encode()和python2 中的encode()不同,python2里的encode()只是单纯的编码。

python3中的encode()在编码的同时还要将其转为bytes类型,decode()在解码的同时还要将bytes类型转为字符串

'''

s='特斯拉'

s_to_unicode=s.decode('UTF-8')#(1)在 python2 中UTF-8先解码到Unicode

unicode_to_gbk=s_to_unicode.encode("gbk")#,然后Unicode在编码到GBK

print(s)#utf-8 乱码

print('unicode:',s_to_unicode)#unicode

print('gbk:',unicode_to_gbk)#gbk

gbk_to_unicode=unicode_to_gbk.decode('gbk')

unicode_to_utf8=gbk_to_unicode.encode('utf-8')

print(gbk_to_unicode)

print(unicode_to_utf8)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值