字符编码

最新推荐文章于 2024-07-23 14:36:35 发布

as1405071

最新推荐文章于 2024-07-23 14:36:35 发布

阅读量81

点赞数

文章标签： python 人工智能

原文链接：http://www.cnblogs.com/setcreed/p/11544697.html

版权

字符编码就是二进制和字符的映射关系

相同点：python解释器是解释执行文件内容的，因而python解释器具备py文件的功能，这一点与文本编辑器一样。

不同点：文本编辑器将文件内容读入内存后，是为了显示或者编辑，根本不会在意python的语法，而python解释器将文件内容读入内存之后，会识别Python语法。

计算机只认识0和1，而我们现在输入的字符计算机是不认识的，必须要经过一个转换过程使得计算机识别人类的字符：

字符……翻译过程……数字

反正就是有这样的一种对应关系，能实现人类字符与数字的对应关系，这玩意称为字符编码表

早期的计算机是美国人搞出来的，搞了一个ASCII表，但这只是美国的标准，而其他国家不能用。因为此刻的各种标准都只是规定了自己国家的文字在内的字符跟数字的对应关系，如果单纯采用一种国家的编码格式，那么其余国家语言的文字在解析时就会出现乱码。

ASCII

接着万国编码Unicode应运而生，但是在纯英文字符中发现，Unicode比ASCII多一倍的空间，这样UTF-8就出现了。

字符	ASCII	Unicode	UTF-8
A	01000001	00000000 01000001	01000001
中	x	01001110 00101101	11100100 10111000 10101101

以上这些基本是废话，记住以下两句话就够了：

python2与python3的编码区别

python2默认用ASCII读入字符，python3默认用utf8读入字符

python2有两种存储变量的形式：

python3只有一种存储变量的形式：Unicode

o_03%20%E5%AD%97%E7%AC%A6%E7%BC%96%E7%A0%81.png

转载于:https://www.cnblogs.com/setcreed/p/11544697.html

关注