计算机中所有的数据本质上都是以0和1的组合来存储。
理解二进制得先理解计算机中的数据单位
b(bit),位 :计算机的最小单位 0011这种二进制中一个数字就代表一位
B(byte),字节 1B=8b
KB(kilobyte),千字节 1KB = 1024B
M(Megabyte),兆 1M = 1024KB
G(Gigabyte),千兆 1G = 1024M
T(Terabyte),万亿字节 1T =1024G
例如,打开基本输入以下文字时,它存储到计算机中可能就是00110110 1010010这种形式存储在内存中了
编码:编码,文字和二进制之间的一个对照表。
不同对照关系就产生多种不同的编码例如:
1.ascii:规定使用1个字节来表示字母与二进制的对应关系。
00000000
00000001 w
00000010 B
00000011 a2.gbk:规定使用2个字节来表示字母与二进制的对应关系。
00000000 00000000 悟
等
目前最广泛的编码为:utf-8,它的优点是全球的文字都有对应的编码,并且存储利用效率比Unicode高得多。
乱码
数据存储到计算机底层时通过二进制数据进行交互的,我们常见的数据内容存储到内存中时得通过一些编码方式把数据编译成二进制文件,但是编码有很多种,比如说UTF-8/GBK/Unicode等,存进去拿出来的编码不同时,会发现乱码现象。