1. python的运行方式
1.1 脚本式
以.py.结尾的文件
xxx.py
1.2 交互式
在Windows中输入【win+R】快捷键打开对话框,输入【cmd】进入,输入python,当系统找到python解释器的时候,即可在当前对话框中进行输入代码。
2. 进制
在计算机中底层的所有数据都是以二级制(011101)的形式存储数据。
2.1 进制类型
-二进制(bin)
-八进制(oct)
-十进制(整数型)
-十六进制(hex)
2.2 进制转换
如图所示:十进制可以转换位二进制、八进制、十六进制,但是二进制、八进制、十六进制之间不可以相互转换,需要先转换为十进制,再转为想要的进制类型。
十进制转换为二进制、八进制、十六进制转换的栗子:
v1 = bin(22) # 十进制转换为二进制
print(v1)
v2 = oct(23) # 十进制转换为八进制
print(v2)
v3 = hex(24) # 十进制转换为十六进制
print(v3)
二进制、八进制、十六进制转换为十进制的栗子:
w1 = int("0b11001",base=2)
w2 = int("0o27",base=8)
w3 = int("0x1c",base=16)
3. 计算机中的单位
由小到大排列:
b(bit)位 < B(byte)字节 < KB(kilobyte)千字节 < M(Megabyte)兆 < G(Gigabyte)千兆<...
8b=1B
1KB=1024B
1M=1024KB
1G=1024M
4. 编码
4.1 ascii编码
ascii规定使用1个字节来表示字母与二进制的对应关系。
4.2 gb-2312编码与gbk编码
gb-2312编码,由国家信息标准委员会制作(1980年)。
gbk编码,对gb2312进行扩展,包含了中日韩等文字(1995年)。
在与二进制做对应关系时,由如下逻辑:
-
单字节表示,用一个字节表示对应关系。2**8 = 256
-
双字节表示,用两个字节表示对应关系。2**16 = 65536种可能性。
4.3 unicode编码
unicode也被称为万国码,为全球的每个文字都分配了一个码位(二进制表示)。
-
ucs2:用固定的2个字节去表示一个文字。
-
ucs4:用固定的4个字节去表示一个文字。
-
在在文件存储和网络传输时,不会直接使用unicode,而在内存中会unicode。因为unicode编码会占用较大的空间,影响传输速度和读取速度。
4.4 utf-8编码
本质上:utf-8是对unicode的压缩,用尽量少的二进制去与文字进行对应。包含所有文字和二进制的对应关系,全球应用最为广泛的一种编码。
感谢阅读~