python解释器在加载.py文件中的代码时,会对内容进行编码
python默认字符编码
- python 2.x默认的字符编码是ASCII,默认的文件编码也是ASCII。( 以utf-8 或者 gbk等编码的代码,加载到内存,并不会转为unicode,编码仍然是utf-8或者gbk等编码。)
- python 3.x默认的字符编码是unicode,默认的文件编码是utf-8。( 以utf-8 或者 gbk等编码的代码,加载到内存,会自动转为unicode正常显示。)
编码方式
1.ASCII
现在我们面临了第一个问题:如何让人类语言,比如英文被计算机理解?我们以英文为例,英文中有英文字母(大小写)、标点符号、特殊符号。如果我们将这些字母与符号给予固定的编号,然后将这些编号转变为二进制,那么计算机明显就能够正确读取这些符号,同时通过这些编号,计算机也能够将二进制转化为编号对应的字符再显示给人类去阅读。由此产生了我们最熟知的ASCII码。ASCII 码使用指定的7 位或8 位二进制数组合来表示128 或256 种可能的字符。这样在大部分情况下,英文与二进制的转换就变得容易多了。

2.GB2312
虽然计算机是美国人发明的,但是全世界的人都在使用计算机。现在出现了另一个问题:如何让中文被计算机理解?这下麻烦了,中文

本文介绍了Python3中字符编码的基础知识,包括默认的Unicode编码、ASCII、GB2312和UTF-8的区别。讨论了Python2和Python3在处理编码上的差异,以及为何会出现编码错误,还详细阐述了Python中编码转换的过程,特别是bytes类型在Python3中的作用。
最低0.47元/天 解锁文章
362

被折叠的 条评论
为什么被折叠?



