byte 和 bit 和 字的区别与联系
byte = 字节 = bait
- Byte是计算机信息技术用于计量存储容量的一种计量单位
- 是一小组相邻的二进制数码;
- 通常是8位作为一个字节;
- 它是构成信息的一个小单位,并作为一个整体来参加操作
- 比bit大
- 比字小,是构成字的单位
- Byte数据类型(字节型)用一个字节(Byte)储存,可区别256个数字,取值范围:0到255。 Byte是从0-255的无符号类型,所以不能表示负数
- 数据存储是以“字节”(Byte)为单位
- 字节是寻址的最小单位
bit = 比特 = binary digit = 位
- bit是表示信息的最小单位,只有两种状态:0和1
- 数据传输大多是以“位”(bit,又名“比特”)为单位
- 每8个位(bit,简写为b)组成一个字节(Byte,简写为B),是最小一级的信息单位
- 实际上普通的计算机系统是无法精确读取和定位到比特(bit)级的信息
- 是电子计算机中最小的数据单位
字 = 计算机字 = word
- 在计算机中,一串数码作为一个整体来处理或运算的,称为一个计算机字,简称字
- 通常若干个字节组成一个“字”
- 字(word)是自然的存储单位
- 字的位数叫做字长,不同机器有不同的字长,一般计算机的字长在864位之间,即一个字由18个字节组成,如一台8位机,它的1个字就等于1个字节,字长为8位.如果是一台16位机,那么,它的1个字就由2个字节构成,字长为16位.
所以呢,理解下
bit 构成 byte ,byte 又构成 字
bit 是最小数据单位,但不对程序员暴露
byte 是数据存储的基本单位
字 是用于处理和运算,是byte的拼装
不同编码格式字和字节关系不一致
-
ASCII码:
一个英文字母(不分大小写)占一个字节的空间,一个中文汉字占两个字节的空间。
一个二进制数字序列,在计算机中作为一个数字单元,一般为8位二进制数,换算为十进制。
最小值0,最大值255。
如一个ASCII码就是一个字节。 -
UTF-8编码:
一个英文字符等于一个字节,一个中文(含繁体)等于三个字节。 -
Unicode编码:
一个英文等于两个字节,一个中文(含繁体)等于两个字节。 -
符号:英文标点占一个字节,中文标点占两个字节。举例:英文句号“.”占1个字节的大小,中文句号“。”占2个字节的大小。