py_1注释及字符集

最新推荐文章于 2024-06-11 08:00:00 发布

BooGooMoo

最新推荐文章于 2024-06-11 08:00:00 发布

阅读量570

点赞数

本文链接：https://blog.csdn.net/BooGooMoo/article/details/90812418

版权

ASCII 占1个字节，只支持英文
GB2312 占2个字节，支持6700+汉字
GBK GB2312的升级版，支持21000+汉字
Shift-JIS 日本字符
ks_c_5601-1987 韩国编码
TIS-620 泰国编码

UTF 是为unicode编码设计的一种在存储和传输时节省空间的编码方案

Python2的默认编码是ASCII ，Python3的默认编码是utf-8

因此，在使用python2时，应在第一行加入#coding=utf-8

python3 执行代码的过程

解释器找到代码文件，把代码字符串按文件头定义的编码加载到内存，转成unicode
把代码字符串按照语法规则进行解释，
所有的变量字符都会以unicode(utf-8)编码

python2并不会以unicode编码，编程时需要在前面加入#coding=utf-8 / #-*-coding:utf-8-*-

它的默认编码是ASCII，想写中文，就必须声明文件头的coding为gbk or utf-8, 声明之后，python2解释器仅以文件头声明的编码去解释你的代码，加载到内存后，并不会主动帮你转为unicode,也就是说，你的文件编码是utf-8,加载到内存里，你的变量字符串就也是utf-8, 这意味着什么你知道么？。。。意味着，你以utf-8编码的文件，在windows是乱码。

(需要人肉转换：https://www.zhihu.com/question/31833164)