python基础知识学习

最新推荐文章于 2024-07-22 22:58:19 发布

dengxianyan4021

最新推荐文章于 2024-07-22 22:58:19 发布

阅读量127

点赞数

文章标签： python 操作系统

原文链接：http://www.cnblogs.com/cyanjng/p/9062073.html

版权

进制学习

二进制；01

八进制；01234567

十进制；0123456789

十六进制；0123456789ABCDEF

八进制列：

输入：oct(8)

输出：0o10

输入：oct(16)

输出'：0o20

输入：oct(64)

输出：0o100

十六进制列：

输入：hex(15)
输出：'0xf'
输入：hex(10)
输出：'0xa'
输入：hex(31)
输出：'0x1f'

二进制定义：

二进制是计算技术中广泛采用的一种树制。二进制数据是用0和1两个数码来表示的数。它的基数为2，进位规则是“逢二进一”，借位规则是“借一当二”，由18世纪德国数理哲学大师莱布尼兹发现。当前的计算机系统使用的基本上是二进制系统，数据在计算机中主要是以补码的形式存储的。计算机中的二进制则是一个非常微小的开关，用“开”来表示1，“关”来表示0。

填位大法：

先把他们代表的值依次写出来，然后再根据10进制的值把数填到相应位置，就好了

十进制转二进制方法相同，只要对照二进制为1的那一位对应的十进制值相加就可以了。

二进制的第n位代表的十进制值都刚好遵循着2的n次方这个规律

ASCII码

ASCII（American Standard Code for Information Interchange，美国信息交换标准代码）是基于拉丁字母的一套电脑编码系统，主要用于显示现代英语和其他西欧语言。它是现今最通用的单字节编码系统，并等同于国际标准ISO/IEC 646。最早只有127个字母被编码到计算机里，也就是大小写英文字母、数字和一些符号，这个编码表被称为ASCII编码，比如大写字母 A的编码是65，小写字母 z的编码是122。后128个称为扩展ASCII码。

由于这些字符串长的长，短的短，写在一起让我们难以分清每一个字符的起止位置，所以聪明的人类就想出了一个解决办法，既然一共就这255个字符，那最长的也不过是11111111八位，不如我们就把所有的二进制都转换成8位的，不足的用0来替换。

在这里，每一位0或者1所占的空间单位为bit(比特)，这是计算机中最小的表示单位

每8个bit组成一个字节，这是计算机中最小的存储单位(毕竟你是没有办法存储半个字符的)orz～

bit           位，计算机中最小的表示单位
8bit = 1bytes 字节，最小的存储单位，1bytes缩写为1B
1KB=1024B
1MB=1024KB
1GB=1024MB
1TB=1024GB
1PB=1024TB
1EB=1024PB
1ZB=1024EB
1YB=1024ZB
1BB=1024YB

GBK和GB2312

显然，对于我们来说能在计算机中显示中文字符是至关重要的，然而刚学习的ASCII表里连一个偏旁部首也没有。所以我们还需要一张关于中文和数字对应的关系表。之前我们已经看到了，一个字节只能最多表示256个字符，要处理中文显然一个字节是不够的，所以我们需要采用两个字节来表示，而且还不能和ASCII编码冲突，所以，中国制定了GB2312编码，用来把中文编进去。

Unicode

因此，Unicode应运而生。Unicode把所有语言都统一到一套编码里，这样就不会再有乱码问题了。

Unicode标准也在不断发展，但最常用的是用两个字节表示一个字符（如果要用到非常偏僻的字符，就需要4个字节）。现代操作系统和大多数编程语言都直接支持Unicode。

现在，捋一捋ASCII编码和Unicode编码的区别：

ASCII编码是1个字节，而Unicode编码通常是2个字节。

字母A用ASCII编码是十进制的65，二进制的01000001；

字符0用ASCII编码是十进制的48，二进制的00110000；

汉字“中”已经超出了ASCII编码的范围，用Unicode编码是十进制的20013，二进制的01001110 00101101。

你可以猜测，如果把ASCII编码的A用Unicode编码，只需要在前面补0就可以，因此，A的Unicode编码是00000000 01000001。

问题出现了：如果统一成Unicode编码，乱码问题从此消失了。但是，如果你写的文本基本上全部是英文的话，用Unicode编码比ASCII编码需要多一倍的存储空间，在存储和传输上就十分不划算。

UTF-8

所以，本着节约的精神，又出现了把Unicode编码转化为“可变长编码”的UTF-8编码。UTF-8编码把一个Unicode字符根据不同的数字大小编码成1-6个字节，常用的英文字母被编码成1个字节，汉字通常是3个字节，只有很生僻的字符才会被编码成4-6个字节。如果你要传输的文本包含大量英文字符，用UTF-8编码就能节省空间：

字符	ASCII	Unicode	UTF-8
A	01000001	00000000 01000001	01000001
中	x	01001110 00101101	11100100 10111000 10101101

从上面的表格还可以发现，UTF-8编码有一个额外的好处，就是ASCII编码实际上可以被看成是UTF-8编码的一部分，所以，大量只支持ASCII编码的历史遗留软件可以在UTF-8编码下继续工作。

文件存取编码转换图

在中国windows默认是GBK
MacOS\Linux默认为UTF-8

Python2编码为ASCII
Python3编码为UTF-8

常用编码介绍一览表

编码	制定时间	作用	所占字节数
ASCII	1967年	表示英语及西欧语言	8bit/1bytes
GB2312	1980年	国家简体中文字符集，兼容ASCII	2bytes
Unicode	1991年	国际标准组织统一标准字符集	2bytes
GBK	1995年	GB2312的扩展字符集，支持繁体字，兼容GB2312	2bytes
UTF-8	1992年	不定长编码	1-3bytes

为什么要用16进制？

因为计算机硬件是0101二进制的，16进制刚好是2的倍数，更容易表达一个命令或者数据。十六进制更简短，因为换算的时候一位16进制数可以顶4位2进制数，也就是一个字节（8位进制可以用两个16进制表示）

最早规定ascll字符采集用的就是8bit（后期扩展了，但是基础单位还是8bit）8bit用两个16进制直接就能表达出来，不管阅读还是储存都比其他进制要方便。

计算机中CPU运算也是遵照ASCLL字符集，以16、32、64的这样方式发展，因此数据交换的时候16进制也显得更好。

为了统一规范，CPU、内存、硬盘我们看到的都是16进制计算。

16进制的应用

1、网络编程，数据交换的时候需要对字节进行解析是一个byte一个byte的处理，一个byte可以用OxFF两个16进制来表达。通过网络抓包，可以看到数据是通过16进制传输的。

2、数据储存，储存到硬件中是0101的方式，储存到系统中的表达方式都是byte方式。

3、一些常用值的定义，比如：我们经常用到的html中color表达，就是用的16进制方式，4个16进制位可以表达好几百万的颜色信息。

转载于:https://www.cnblogs.com/cyanjng/p/9062073.html

dengxianyan4021

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python基础知识学习

进制学习二进制；01八进制；01234567十进制；0123456789十六进制；0123456789ABCDEF八进制列：输入：oct(8)输出：0o10输入：oct(16)输出'：0o20输入：oct(64)输出：0o100十六进制列：输入：hex(15)输出：'0xf'输入：hex(10)输出：'0xa'输入：h...
复制链接

扫一扫