计算机中的字符和字节的关系

一个字符占几个字节?

  1. 在ASCII码编码方案中,一个英文字符占用一个字节,一个汉字字符占用两个字节的空间;
  2. 在Unicode编码方案中,一个英文字符或一个汉字字符都占用两个字节的空间;
  3. 3.在UTF-8编码方案中,一个英文字符占用一个字节,一个汉字字符占用三个字节的空间。

如何理解

信息通常以字符编码的方式存在于计算机中,并进行信息传播。而字符编码又有不同的方案,鉴于世界上有各种各样的语言字符信息,为了把这些符号信息编码到计算机中,并进行互相传播,字符的编码方案也层出不穷。
下面对以下三种字符编码方案加以介绍:

  1. ASCII码。ASCII码是美国信息交换标准编码,是世界上最通用的计算机符号编码。ASCII码用7个二进制位共编码128个字符。
    在ASCII编码中,一个英文字母或其他字符占用一个字节,一个中文汉字在ASCII码的兼容方案中占用两个字节。

  2. Unicode定长编码。统一码,Universal Multiple-OctetCoded Character Set,简称UCS,俗称unicode,万国码。
    世界上所有的语言包含的符号,都在unicode里面有唯一的编码。Uicode采用两个字节的编码方式,把世界上所有的语言的文字字符都容纳了进来。
    在Unicode的编码方案中,一个英文字母或字符占用两个字节的空间,同样一个中文字符包括繁体字,也是占用两个字节的空间。

  3. UTF-8编码,不定长度编码。UTF,全称Unicode Transfer Format,统一码传输格式。它是一种针对Unicode的一种可变长度的字符编码方案。

    UTF-8编码使用1~4个字节对所有的字符进行编码,对于ASCIl码的那些字符采用一个字节,从而保证与ASCIl的完全兼容。
    对于拉丁文、希伯来文等字母采用2个字节进行编码;对于中日韩、东南亚等文字,采用3个字节进行编码。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

泰瑞_

知识源于创作热情,感谢你的支持

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值