位、字节与字符

本文详细介绍了计算机中位(bit)、字节(Byte)的概念及其关系,以及字符编码如ASCII、UTF-8、Unicode和UTF-16中字符与字节的对应方式。讨论了不同编码下英文字符和汉字的存储需求,帮助理解计算机存储和字符编码的基本原理。
摘要由CSDN通过智能技术生成

1 bit

bit,称为“位”,音译为“比特”,是计算机中存储信息的最小单位,二进制的一个“0”或者一个“1”称为一位

2 字节

Byte,称为“字节”,是计算机存储容量基本单位,8位为1字节,8bit = 1B。

1个字节等于8个bit位,每个bit位又0/1两种状态,也就是说一个字节可以表示256个状态,计算机里用字节来作为最基本的存储单位。
计算机存储容量大小以字节数来度量,1024进位制:

8bit = 1B

1024B=1K(千)B

1024KB=1M(兆)B

1024MB=1G(吉)B

1024GB=1T(太)B

以下还有PB、EB、ZB、YB 、NB、DB,一般人不常使用

3 字符

字符是指计算机中使用的文字和符号,比如1、2、3、A、B、C、~!·#¥%……—*()——+、等等。

一般来说,英文状态下一个字母或数字(称之为字符)占用一个字节,一个汉字用两个字节表示。
不同编码里,字符和字节的对应关系不同: 

1.ASCII码中:一个英文字符(不分大小写)占一个字节的空间,一个中文汉字占两个字节的空间。 一个二进制数字序列,在计算机中作为一个数字单元,一般为8位二进制数,换算为十进制。最小值0,最大值255。

 1个英文字符 => 1B

 1个汉字 => 2B

2.UTF-8编码中:一个英文字符等于一个字节,一个中文(含繁体)等于三个字节。

 1个英文字符 => 1B

 1个汉字 => 2B

3.Unicode编码中:一个英文字符等于两个字节,一个中文(含繁体)等于两个字节。符号:英文标点占一个字节;中文标点占两个字节。

1个英文字符 => 1B

1个汉字 => 2B

1个英文标点 => 1B

1个中文标点 => 2B

4.UTF-16编码中:一个英文字母字符或一个汉字字符存储都需要2个字节(Unicode扩展区的一些汉字存储需要4个字节)。

 1个英文字符 => 2B

 1个汉字 => 2B

5.UTF-32编码中:世界上任何字符的存储都需要4个字节。

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值