二进制与字符编码
1Byte=8bit
1Kb=1024byte
1Mb=1024kb
1Gb=1024mb
1Tb=1024gb
一位可以表示2种状态,两位可以表示4种状态,八位可以表示256种状态,假设n为位数,那么可以表示2^n种状态,这么种状态不好记忆,于是就有了ASCLL码表(一个字节表示一个字符)
80年代时发布了GB2312来表示简体中文,一共可以表示7445个字符
90年代发布了GBK不仅可以表示简体中文,也可以表示繁体中文
由于有少数民族文字,所以在2000推出了GB18030,可以表示27484个字符,而且规定有的字符可以一个,两个,四个字节组成。
其他国家,也有自己的编码,这样同样的数字可能就会表示不同,就会混乱,用unicode来同一全世界的字符。
unicode同一用两个byte表示。UTF-8规定英文用1byte,中文用3个byte。unicode用来同一个字符需要用那个数字来表示。
比如“乘”,16进制为4E58,使用计算器的程序员模式,易得二进制
0100111001011000,chr()函数是将整型转化为字符。0b中的0是防止py认为为变量名,binary就为二进制,ord()函数是将字符的unicode码找出来。具体操作如下图:
标识符和保留字
保留字是python不让用给任何对象命名的单词:
'False', 'None', 'True', 'and', 'as', 'assert', 'async', 'await', 'break', 'class', 'continue', 'def', 'del', 'elif', 'else', 'except', 'finally', 'for', 'from', 'global', 'if', 'import', 'in', 'is', 'lambda', 'nonlocal', 'not', 'or', 'pass', 'raise', 'return', 'try', 'while', 'with', 'yield'
标识符:
变量,函数,类,模块和其他对象起的名字就叫标识符
1.字母,下划线,数字组成
2.不能以数字开头
3.不能是保留字
4.严格区分大小写
变量的定义和使用
变量是内存中的带标签的盒子,由标识,类型和值组成。
在变量多次赋值时,id会变指向的位置会变,如图:
不积跬步无以至千里,不积小流无以成江海