Python的进制与编码

1. python的运行方式

1.1 脚本式

以.py.结尾的文件

xxx.py

1.2 交互式

在Windows中输入【win+R】快捷键打开对话框,输入【cmd】进入,输入python,当系统找到python解释器的时候,即可在当前对话框中进行输入代码。

2.  进制

在计算机中底层的所有数据都是以二级制(011101)的形式存储数据。

2.1 进制类型

-二进制(bin)

-八进制(oct)

-十进制(整数型)

-十六进制(hex)

2.2 进制转换

如图所示:十进制可以转换位二进制、八进制、十六进制,但是二进制、八进制、十六进制之间不可以相互转换,需要先转换为十进制,再转为想要的进制类型。

十进制转换为二进制、八进制、十六进制转换的栗子:

v1 = bin(22) # 十进制转换为二进制
print(v1) 

v2 = oct(23) # 十进制转换为八进制
print(v2)

v3 = hex(24) # 十进制转换为十六进制
print(v3) 

二进制、八进制、十六进制转换为十进制的栗子:

w1 = int("0b11001",base=2) 

w2 = int("0o27",base=8) 

w3 = int("0x1c",base=16) 

3. 计算机中的单位

由小到大排列:

b(bit)位 < B(byte)字节 < KB(kilobyte)千字节 < M(Megabyte)兆 < G(Gigabyte)千兆<...

8b=1B

1KB=1024B

1M=1024KB

1G=1024M

4. 编码

4.1 ascii编码

ascii规定使用1个字节来表示字母与二进制的对应关系。

4.2 gb-2312编码与gbk编码

gb-2312编码,由国家信息标准委员会制作(1980年)。

gbk编码,对gb2312进行扩展,包含了中日韩等文字(1995年)。

在与二进制做对应关系时,由如下逻辑:

  • 单字节表示,用一个字节表示对应关系。2**8 = 256

  • 双字节表示,用两个字节表示对应关系。2**16 = 65536种可能性。

4.3 unicode编码

unicode也被称为万国码,为全球的每个文字都分配了一个码位(二进制表示)。

  • ucs2:用固定的2个字节去表示一个文字。

  • ucs4:用固定的4个字节去表示一个文字。

  • 在在文件存储和网络传输时,不会直接使用unicode,而在内存中会unicode。因为unicode编码会占用较大的空间,影响传输速度和读取速度。

4.4 utf-8编码

本质上:utf-8是对unicode的压缩,用尽量少的二进制去与文字进行对应。包含所有文字和二进制的对应关系,全球应用最为广泛的一种编码。

感谢阅读~

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值