字符字节区别,各种编码格式作用

一、

  1. 字符:由数字,字母,标点符号,各种符号。。。组成的都叫做字符。
  2. 字节:字节是计算机中存储容量的基本单位,1字节是在计算机中是8位。也就是从 00000000到11111111。在计算机里面,无论你什么样的文件,到最后都会被转为0,1的组成序列来表示,那么问题来了,我们肯定要制定规则呀,比如00011001代表哪个字符,这些都是我们人为后面规定的,所以我们就引入了编码格式:ANCI、UTF-8、GBK、UTF-16、UTF-32…等等很多很多编码格式就应运而生。

3.编码格式:ANCI、UTF-8、GBK、UTF-16、UTF-32…。记住一句话,这些编码格式作用就是:一个字符在计算机中到底占几个字节。不同的编码格式对这个的规定是不一样的。
1、ANCI编码码中:标点符号、数字、大小写字母都占一个字节,汉字占2个字节。
一个二进制数字序列,在计算机中作为一个数字单元,一般为8位二进制数,换算为十进制。最小值0,最大值255。

2、UTF-8编码中:一个英文字符等于一个字节,一个中文(含繁体)等于三个字节。

3、Unicode编码中:一个英文字符等于两个字节,一个中文(含繁体)等于两个字节。
      符号:英文标点占一个字节;中文标点占两个字节。
      举例:英文句号“.”占1个字节的大小;中文句号“。”占2个字节的大小。

4、UTF-16编码中:一个英文字母字符或一个汉字字符存储都需要2个字节(Unicode扩展区的一些汉字存储需要4个字节)。

5、UTF-32编码中:世界上任何字符的存储都需要4个字节。
6、GBK编码中:英文字符1个字节,中文字符2个字节.

总结

以前我基本上看到字符字节就躲着它们,后来实在躲不了,今天和它们做个了断,如果我说的不对,请赐教。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值