一、进制
1、十进制
- 十进制就是满十进一的进制
- 十进制当中一共有10个数字
0 1 2 3 4 5 6 7 8 9
2、二进制(计算机底层使用的进制)
- 满二进一
- 二进制中一共有2个数字
- 二进制的计数方式
0 1 10 11 100 101.........
- 所有的数据在计算机底层都是以二进制的形式保存的,计算机只认二进制
- 可以将内存想象为一个一个的小格子,小格子中可以存储一个0或一个1
- 内存中的每一个小格子称为1bit(位)
bit是计算机中的最小单位
byte是我们最小的可操作的单位
8bit = 1byte(字节)
1024byte = 1kb(千字节)
1024kb = 1mb (兆字节)
1024mb = 1gb (吉字节)
1024gb = 1tb (太字节)
..................
3、八进制
- 满八进一
4、十六进制
- 满十六进一
- 表示方式
0 1 2 3 4 5 6 7 8 9 A B C D E F 10 11........
- 我们在查看二进制数据时,一般会以十六进制的形式显示
二、文本文件和字符集
文本分成两种,非为纯文本和富文本
纯文本中只能保存单一的文本内容,无法保存内容无关的东西(字体、颜色、图片…)
在开发时,辨析程序使用的全都是纯文本
纯文本在计算机底层也会转换为二进制保存
将字符转换为二进制码的过程,称为编码
将二进制码转化为字符的过程,称为解码
编码和解码时所采用的规则,称为字符集
常见的字符集:
ASCII 美国编码,使用7位对美国常用的字符进行编码(包含128个字符)
ISO-8859-1 欧洲编码,使用8位(包含256个字符)
GB2312 国标码
GBK 国标码
Unicode 万国码,包含世界上所有的语言和符号,在编写程序时一般都会使用此编码
Unicode编码有多种实现,UTF-8,UTF-16,UTF-32
最常用的就是UTF-8
乱码 编写程序时,如果发现程序代码出现乱码的情况,就要马上去检查字符集是否正确
富文本中可以保存文本以外的内容(word文档)