python3中字符编码转换

最新推荐文章于 2024-08-08 14:52:18 发布

米仓里的米老鼠

最新推荐文章于 2024-08-08 14:52:18 发布

阅读量6.5k

点赞数 3

分类专栏： Python 文章标签： python3 编码转换

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/x8mouse/article/details/82984497

版权

Python 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

# Python3编码转换已经不像python2那样让人崩溃, 但是在使用过程中需要遵循一定规则

# 各种编码的互相转换, 都要先decode解码为unicode编码, 然后通过unicode再encode编码为想要的编码

s = '我是Python'

# unicode to gb2312

# unicode编码不需要decode()解码，直接encode()编码,如gb2312

gb2312 = s.encode('gb2312')

print('gb2312编码:',gb2312) # gb2312编码: b'\xce\xd2\xca\xc7Python'

# gb2312 to utf8

# gb2312编码需要先decode解码成unicode, decode()解码函数中传入的参数为当前字符的编码集,然后再encode编码成utf-8

utf8 = gb2312.decode('gb2312').encode('utf-8')

print('utf-8编码:',utf8) # utf-8编码: b'\xe6\x88\x91\xe6\x98\xafPython'

# utf8 to gbk

# 同样的,utf-8编码需要先decode解码为Unicode, 再encode编码换成gbk字符集

gbk = utf8.decode('utf-8').encode('gbk')

print("gbk编码:",gbk) # gbk编码: b'\xce\xd2\xca\xc7Python'

# utf8 to uicode

# 当转换成unicode时,直接decode解码就行, 并不需要就行encode()编码

unicode = gbk.decode('gbk')

print('unicode编码:', unicode) # unicode编码: 我是Python

# unicode to gb18030

gb18030=unicode.encode('gb18030')

print('gb18030编码:', gb18030) # gb18030编码: b'\xce\xd2\xca\xc7Python'

#从输出结果可以看出gb2312，gbk，gb18030返回的结果都是一样的, 只是3个编码集范围不同.

# Python3 中还存在字符字符串与二进制编码转换的问题:

# 二进制 -> 转换 -> 字符串需要解码 decode

# 字符串 -> 转换 -> 二进制需要编码 encode

#比如,读取网页的结果:

response = urllib.request.urlopen( 'http://www.baidu.com' )

html = response.read() # 此时html就是bytes类型的, 使用需要进行转换

# str to bytes

print(str.encode(s)) # 字符串转bytes 输出结果:b'\xe6\x88\x91\xe6\x98\xafPython'

# bytes to str

print(bytes.decode(html) ) # bytes转字符串

米仓里的米老鼠

关注

3
点赞
踩
6

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。