关于进制
进制
十进制
特点:①满十进一
②计数:0 1 2 3 4 5 6 7 …12 13 …19 20
③单位数字 十个(0—9)
二进制
特点:①满二进一
②计数:0 1 10 11 100 110 111
③单位数字:2个(0—1)
八进制
特点:①满八进一
②计数:0 1 2 3 4 5 6 7 10 11 … 17 20
③单位数字:8个(0—7)
十六进制
(一般显示一个二进制数字时,都会转换为十六进制)
特点:①满十六进一
②计数:0 1 2 3 4 5 6 7 8 9 a b c d e f 10 11 12 …1a 1b 1c 1d 1e 1f 20…
③单位数字:16个(0—f)
注意
-所有数据在计算机底层都会以二进制的形式保存
-可以将内存想象为一个有多少个小格子组成的容器,每一个小个子都可以存储一个1或者一个0.
这个小格子在内存中被称为1位(bit)
字节换算
8bit=1byte(字节)
1024byte = 1 kb(千字节)
1024kb = 1 mb(兆字节)
1024mb = 1 gb(吉字节)
1024gb = 1 tb(特字节)
1024tp = 1pb
字符编码
- 我们所有的数据在计算机中存储时都是以二进制的形式存储的,文字也不例外。
- 所有一般的文字存储时,都需要转换为二进制编码。
- 当我们读取这段文字时,计算机会将编码转换成字符,供我们阅读。
编码
将字符转换为二进制的过程叫做编码
解码
将二进制转换成字符的过程叫做解码
字符集
编码和解码采用的规则成为字符集(charset)
乱码问题
如果编码和解码采用的字符集不同就会出现乱码问题
常见的字符集
ASCII
ASCII是基于拉丁字母的一套电脑编码系统。它主要用于显示现代英语,而其扩展版本延伸美国标准信息交换码则可以部分支持其他西欧语言,并等同于国际标准ISO/IEC 646。
ISO88591
编码是单字节编码,向下兼容ASCII,其编码范围是0x000xFF,0x000x7F之间完全和ASCII一致,0x800x9F之间是控制字符,0xA00xFF之间是文字符号
GB2312
GB2312编码适用于汉字处理、汉字通信等系统之间的信息交换,通行于中国大陆;新加坡等地也采用此编码。中国大陆几乎所有的中文系统和国际化的软件都支持GB 2312。
GBK
GBK即汉字内码扩展规范,K为扩展的汉语拼音中“扩”字的声母。英文全称Chinese Internal Code Specification。GBK编码标准兼容GB2312,共收录汉字21003个、符号883个,并提供1894个造字码位,简、繁体字融于一库。
UTF-8
UTF-8是一种针对Unicode的可变长度字符编码,由Ken Thompson于1992年创建。它可以用来表示Unicode标准中的任何字符,且其编码中的第一个字节仍与ASCII兼容,这使得原来处理ASCII字符的软件无须或只须做少部份修改,即可继续使用。
HTML中怎样设置字符集,避免乱码
使用charset标签,但是注意了
这里的UTF-8要和下图中你的软件里的字符集一样
如果我们的字符集不一致,那么会出现以下情况
就会出现这种看都看不懂的乱码!