c语言与多字节编码,什么是单字节,双字节和多字节编码

满意答案

00e27ab806e4881f8254fe7ae8741834.png

sjdysppgd

2016.03.15

00e27ab806e4881f8254fe7ae8741834.png

采纳率:58%    等级:9

已帮助:1567人

很久很久以前,有一群人,他们决定用8个可以开合的晶体管来组合成不同的状态,以表示世界上的万物。他们认为8个开关状态作为原子单位很好,于是他们把这称为"字节"。

于是8个二进制就是一字节!!2的8次方256,可以表示256个不同的字符!!

单字节编码:典型的"Ascii"编码,所有的空格、标点符号、数字、大小写字母分别用连续的字节状态表示,一直编到了第127号!!

双字节编码:典型的我们自己用的gb2312就是,由于,除了使用英语之外的民族也要用电脑,并且有自己的文字,且256个不够用。聪明中国人民是这样做的,:一个小于127的字符的意义与原来相同,但两个大于127的字符连在一起时,就表示一个汉字,前面的一个字节(他称之为高字节)从0xA1用到 0xF7,后面一个字节(低字节)从0xA1到0xFE,这样我们就可以组合出大约7000多个简体汉字了。在这些编码里,我们还把数学符号、罗马希腊的字母、日文的假名们都编进去了,连在 ASCII 里本来就有的数字、标点、字母都统统重新编了两个字节长的编码,这就是常说的"全角"字符,而原来在127号以下的那些就叫"半角"字符了。后来还是不够用,于是干脆不再要求低字节一定是127号之后的内码,只要第一个字节是大于127就固定表示这是一个汉字的开始,不管后面跟的是不是扩展字符集里的内容。结果扩展之后的编码方案被称为 GBK 标准,GBK 包括了 GB2312 的所有内容,同时又增加了近20000个新的汉字(包括繁体字)和符号。

多字节编码:就是多个字节来表示一个字符!!

20分享举报

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值