Unicode到UTF-8的转换详解

最新推荐文章于 2024-06-07 15:19:33 发布

叶之香

最新推荐文章于 2024-06-07 15:19:33 发布

阅读量1k

点赞数

分类专栏： C/C++ 文章标签： basic

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xiejianjun417/article/details/7829720

版权

C/C++ 专栏收录该内容

33 篇文章 0 订阅

订阅专栏

Unicode是一个字符集，而UTF-8是Unicode的其中一种，Unicode是定长的都为双字节，而UTF-8是可变的，对于汉字来说Unicode占有的字节比UTF-8占用的字节少1个字节。Unicode为双字节，而UTF-8中汉字占三个字节。

UTF-8编码字符理论上可以最多到6个字节长,然而16位BMP（Basic Multilingual Plane）字符最多只用到3字节长。下面看一下UTF-8编码表：

U-00000000 - U-0000007F: 0xxxxxxx

U-00000080 - U-000007FF: 110xxxxx 10xxxxxx

U-00000800 - U-0000FFFF: 1110xxxx 10xxxxxx 10xxxxxx

U-00010000 - U-001FFFFF: 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx

U-00200000 - U-03FFFFFF: 111110xx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx

U-04000000 - U-7FFFFFFF: 1111110x 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx

x表示对应的二进制位。在多字节串中, 第一个字节的开头"1"的数目就是整个串中字节的数目。而第一行中以0开头，是为了兼容ASCII编码，为一个字节；第二行就为双字节字符串；第三行为3字节，如汉字就属于这种，以此类推。

下面来看一下，在Unicode中的编码是怎样转换成UTF-8的，在UTF-8中，如果一个字符的字节小于0x80（128）则为ASCII字符，占一个字节，可以不用转换，因为UTF-8兼容ASCII编码。假如在Unicode中汉字“你”的编码为“u4F60”，把它转换为二进制为100111101100000，然后按照UTF-8的方法进行转换。可以将Unicode二进制从地位往高位取出二进制数字，每次取6位，如上述的二进制就可以分别取出为如下所示的格式，前面按格式填补，不足8位用0填补。

unicode: 100111101100000 4F60

utf-8: 11100100,10111101,10100000 E4BDA0

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Unicode到UTF-8的转换详解

Unicode是一个字符集，而UTF-8是Unicode的其中一种，Unicode是定长的都为双字节，而UTF-8是可变的，对于汉字来说Unicode占有的字节比UTF-8占用的字节少1个字节。Unicode为双字节，而UTF-8中汉字占三个字节。 UTF-8编码字符理论上可以最多到6个字节长,然而16位BMP（Basic Multilingual Plane）字符最多只用到3字节长。下面看一
复制链接

扫一扫

专栏目录

叶之香 CSDN认证博客专家 CSDN认证企业博客

码龄16年

73: 原创

7万+: 周排名

16万+: 总排名

20万+: 访问

: 等级

2722: 积分

38: 粉丝

58: 获赞

60: 评论

224: 收藏

私信

关注

热门文章

分类专栏

最新评论

kmp字符串匹配C实现
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性；(2)使用更多的站内链接；(3)增加除了各种控件外，文章正文的字数。
VMware Workstation16/17安装CentOS7.9 32位卡住解决方法
叶之香: 安装过程中，应该是不会在线下载包的。系统安装中用到的包都在ISO里面。有可能是ISO有损坏
VMware Workstation16/17安装CentOS7.9 32位卡住解决方法
爱喝cola的: 安装过程中
VMware Workstation16/17安装CentOS7.9 32位卡住解决方法
叶之香: 你是指安装过程中下载包？还是系统安装后使用yum下载包？
VMware Workstation16/17安装CentOS7.9 32位卡住解决方法
爱喝cola的: 安装这个虚拟机，我搞了一个星期了。vm15报hcomn错误，怎么调都不行。vm16/17安装centos在下载centos各种包那里卡住，服了

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。