Python中encode和decode

最新推荐文章于 2024-01-29 12:18:11 发布

天上飞下一毛雪

最新推荐文章于 2024-01-29 12:18:11 发布

阅读量407

点赞数

分类专栏： Python

本文链接：https://blog.csdn.net/qq_39622065/article/details/105581139

版权

Python 专栏收录该内容

82 篇文章 3 订阅

订阅专栏

encode按照指定方式进行编码，decode将对应的编码转化为utf-8编码所对应的字符。

‘hex’代表以16进制进行编码，

str = '\x35'.encode('hex')
print str

str = '9'.encode('hex')  #39
print str

str = '10'.encode('hex') #3130
print str

str = '11'.encode('hex') #3131
print str

print '3130'.decode('hex')

字符9：10进制编码为57，Unicode编码16进制为39，和上述代码一致。

中国人民通过对 ASCII 编码的中文扩充改造，产生了 GB2312 编码，可以表示6000多个常用汉字。
汉字实在是太多了，包括繁体和各种字符，于是产生了 GBK 编码，它包括了 GB2312 中的编码，同时扩充了很多。
中国是个多民族国家，各个民族几乎都有自己独立的语言系统，为了表示那些字符，继续把 GBK 编码扩充为 GB18030 编码。
每个国家都像中国一样，把自己的语言编码，于是出现了各种各样的编码，如果你不安装相应的编码，就无法解释相应编码想表达的内容。
终于，有个叫 ISO 的组织看不下去了。他们一起创造了一种编码 UNICODE ，这种编码非常大，大到可以容纳世界上任何一个文字和标志。所以只要电脑上有 UNICODE 这种编码系统，无论是全球哪种文字，只需要保存文件的时候，保存成 UNICODE 编码就可以被其他电脑正常解释。
UNICODE 在网络传输中，出现了两个标准 UTF-8 和 UTF-16，分别每次传输 8个位和 16个位。于是就会有人产生疑问，UTF-8 既然能保存那么多文字、符号，为什么国内还有这么多使用 GBK 等编码的人？因为 UTF-8 等编码体积比较大，占电脑空间比较多，如果面向的使用人群绝大部分都是中国人，用 GBK 等编码也可以。

天上飞下一毛雪

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Python中encode和decode

encode按照指定方式进行编码，decode将对应的编码转化为utf-8编码所对应的字符。‘hex’代表以16进制进行编码，str = '\x35'.encode('hex')print strstr = '9'.encode('hex') #39print strstr = '10'.encode('hex') #3130print strstr = '11'.e...
复制链接

扫一扫