UTF-8是现在流行的编码方式,根据规定回答问题

UTF-8是现在流行的编码方式,下面是RFC2279对UTF-8编码规则的规定
   UCS-4 range (hex.)           UTF-8 octet sequence (binary)
   0000 0000-0000 007F   0xxxxxxx
   0000 0080-0000 07FF   110xxxxx 10xxxxxx
   0000 0800-0000 FFFF   1110xxxx 10xxxxxx 10xxxxxx

   0001 0000-001F FFFF   11110xxx 10xxxxxx 10xxxxxx 10xxxxxx
   0020 0000-03FF FFFF   111110xx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx
   0400 0000-7FFF FFFF   1111110x 10xxxxxx ... 10xxxxxx
根据这个规则,中文字符‘我’的unicode值为0X6211,utf-8编码之后为0XE68891。 请回答以下问题:<br />

A)英文字符‘a’,其unicode的十六进制值为0X61,则其UTF-8编码后的十六进制值为 1 ?

参考答案 0X61

B)中文字符‘腾’,其unicode的十六进制值为0X817E,则其UTF-8编码后的十六进制值为 2 ?

参考答案 0XE885BE

C)中文字符‘讯’,其unicode值经过UTF-8编码之后为0XE8AEAF,则请问其unicode的十六进制值是 3 ?

参考答案 0X8BAF

解析:

A、0X61在0X00-0X7F之间,所以和ASCII编码完全相同,所以UTF-8编码后的值还是0X61。

B、0X817E在0X0800-0XFFFF之间,使用了3字节模版 1110xxxx 10xxxxxx 10xxxxxx,将0X817E写成二进制1000 0001 0111 1110,用这个比特流依次替代模版中的x,得到11101000 10000101 10111110,即E885BE。

C、0XE8AEAF的二进制为11101000 10101110 10101111是3字节模版,则unicode二进制值为1000 1011 1010 1111,十六进制值为0X8BAF。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: GBK和UTF-8是两种常见的字符编码方式,其中GBK是国标规定的汉字内码表,而UTF-8是一种通用的编码方式。 GBK编码表包括两个部分:区位码和汉字内码。其中,区位码是由区号和位号组成,用来表示汉字在GBK编码表中的位置;而汉字内码是由两个字节组成,用来表示实际的字符编码。 与此不同的是,UTF-8使用8位序列来表示字符,可用于表示多种语言的字符集,包括英语、汉语、日语等等。UTF-8采取变长编码,不同的字符可以采用1~4个字节来表示,从而更加灵活和高效。 在实际应用中,需要使用转换工具将不同编码方式的字符集进行转换,以便正确地显示和处理文本。通常使用的工具包括iconv、ficonv、uconv等等。 总之,GBK和UTF-8是两种不同的字符编码方式,可以用于存储和传输不同语言的文本信息,需要根据具体的需求选择合适的编码方式。 ### 回答2: GBK和UTF-8都是字符编码标准,其中GBK是基于汉字的编码标准,而UTF-8则是一种通用的编码标准。 GBK编码标准是由中国国家标准局开发的,它支持简体和繁体中文,在GBK对照表中,每个汉字都有一个唯一的二进制编码值。GBK编码可以表示21676个中文汉字以及其他符号和字符。由于GBK编码是双字节的编码方式,因此使用GBK编码的文件大小通常比使用其他单字节编码的文件大小大一倍。 而UTF-8是一种可变长度的编码标准,它支持所有Unicode字符,并且在表示ASCII字符时可以使用单字节编码,不会出现文件大小双倍的问题。在UTF-8的对照表中,每个字符的编码长度可以是1到4个字节。 在GBK和UTF-8之间进行转换时,需要使用相应的对照表进行转换。通常情况下,GBK编码被用于在Windows系统下进行文本显示和存储,而UTF-8编码则被用于在Web上显示和存储文本。 ### 回答3: GBK和UTF-8是计算机编码中常用的两种字符集,都是用于支持中文编码。GBK是国家标准GB2312的扩展,支持汉字和日韩假名。而UTF-8是Unicode字符集的一种编码方式,支持全球范围内的字符,包括亚洲语言、欧洲语言、非洲语言、拉美语言以及其他语言。下面是GBK和UTF-8对照表的一些例子: GBK编码:中文字符“你”的编码为B7 E7,英文字符“a”的编码为61; UTF-8编码:中文字符“你”的编码为E4 BD A0,英文字符“a”的编码为61。 从上述对比可以看出,UTF-8编码相比GBK编码所占用的空间更大,但UTF-8支持更多种语言和字符。在实际应用中,程序员需要根据具体的需求选择采用哪种编码方式,以充分发挥其优势。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值