目录
位
bit,比特位,计算机中的一个标识单位,用来表示,指示灯的开、关。也就是二进制中的 0,1。
为啥叫位呢,可以这样理解,有个二进制数据,10101010,一共8个数字,单独提出来是为了表示尊敬,所以称“喂”,逐渐变成了尊称,位,单独出来一个数字,他的变化就是0,1。所以我们对把他成为:2^1
计算机所说的32位、64位是什么呢
通常所说的32位机是指计算机数据总线宽度为32位,所谓32位处理器就是一
次只能处理32位,也就是4个字节的数据。有个问题有些意思。
32位处理器的寻址空间最大为4GB为什么。答案详情在下边
字节
byte,字节,1byte=8bit。我记得是跟ASCII字符集有关,本来有4位、6位等,称呼也是4位字节,6位字节,简单意骇。有个二进制数据,00101010,一共8位,这就是一个字节。
这件事得追溯计算机历史,源于IBM360操作系统和图灵奖得主(Fred)Brooks Jr。
布鲁克斯被问到“您认为自己最大的技术成就是什么?”
Brooks回答说:“我做出的最重要的决定是将IBM 360系列从6位更改为8位字节,从而允许使用小写字母。这种变化传播到了所有地方。”
计算机的存储单位
还有一个点是,计算机的存储单位:
1byte=8bit
1kb=1024byte
1m=1024kb
1g=1024m
只有位到字节是8,其他的都是1024也就是2^10
32位处理器的寻址空间最大为4GB为什么?
32位意味着有2^32中变化。
因为CPU的寻址能力以字节为单位,
即对应到内存就是2^32字节
2^32字节 = 4*2^30 = 4*2^10 *2^10 *2^10 = 4G
即寻址能力最大为4GB
字
字,英文字母(大写,小写),中文等
如何用二进制来表示字呢,人们设定了字符集,使用二进制来表示文字。
字符集有:ascii 、gbk、unicode、utf8。
ascii
计算机刚发明时,用7、8位二进制来表示大小写英文和一些标识符。
gbk
计算机传进中国,因为没有汉字,中国设定了gbk,用来存储展示中文
unicode
由于世界各国使用计算机的越来越多,需要统一对世界所有语言进行再次编码,就设定了unicode,比如中文部分就是对gbk再次编码,所以,gbk可以转成unicode。
utf8
这个还是使用方是英文,如果使用unicode对英文是需要两个字节,但是ascii只需要一个字节,utf8是对此进行的调整,结果就是将英文部分使用ascii字符集,其他语言在unicode的基础上进行了一些调整,所以Unicode可以转utf8。
比如怎么把gbk转utf8呢,
只需要,先将gbk转成unicode;再将Unicode转utf8。
关于中英文字不同字符集所需字节
uft8:一个中文3个字节,一个英文字母一个字节。
gbk:一个中文2个字节,一个英文字母一个字节。
unicode:一个中文2个字节,一个英文2个字节。