UTF - 8 编码格式简单介绍

最新推荐文章于 2022-06-05 02:56:07 发布

恨天低

最新推荐文章于 2022-06-05 02:56:07 发布

阅读量1.1k

点赞数

分类专栏：网络编程文章标签： c

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/icechenbing/article/details/7049590

版权

网络编程专栏收录该内容

14 篇文章 0 订阅

订阅专栏

// UTF-8 编码字符理论上可以最多到 6个字节长，但目前全世界的所

// 有文字和符号种类加起来也只要编到 4个字节长就够了。

// 　　UTF-8 是以 8位（即 1个字节）为单元对原始码进行编码（注意一

// 点：这里所讲的原始码都是指Unicode码），并规定：多字节码（2个字

// 节以上才称为多字节）以转换后第1个字节起头的连续“1”的数目（这

// 些连续“1”称为标记位），表示转换成几个字节：“110”连续两个

// “1”，表示转换结果为2个字节，“1110”表示3个字节，而“11110”

// 则表示4个字节……跟随在标记位之后的“0”，其作用是分隔标记位和

// 字符码位。第2～第4个字节的起头两个位固定设置为“10”，也作为标

// 记，剩下的6个位才做为字符码位使用。

// 　　这样，2字节UTF-8码剩下11个字符码位，可用以转换0080～07FF的

// 原始字符码，3字节剩下16个字符码位，可用以转换0800～FFFF的原始字

// 符码，由此类推。编码方式的模板如下：

//// 原始码（16进制）　UTF－8编码（二进制）

// --------------------------------------------

// 0000 - 007F 0xxxxxxx

// 0080 - 07FF 110xxxxx 10xxxxxx

// 0800 - FFFF 1110xxxx 10xxxxxx 10xxxxxx

// ……

// --------------------------------------------

//// 　　模板中的“x”表示字符码。

// 　　Ascii码＜007F，编为1个

// 字节的UTF－8码。汉字的 Unicode编码范围为0800－FFFF，所以被编为

// 3个字节的UTF－8码。

// 　　例如“汉”字的Unicode编码是6C49，6C49在0800-FFFF之间，所以

// 要用3个字节的模板：1110wwww 10xxxxyy 10yyzzzz。

// 6 C 4 9

// 0110 1100 0100 1001

// wwww xxxx yyyy zzzz

// wwww xxxxyy yyzzzz

// 1110wwww 10xxxxyy 10yyzzzz。

// 11100110 10110001 10001001

// E 6 B 1 8 9

//“汉”字的UTF-8编码是E6 B1 89

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
UTF - 8 编码格式简单介绍

// UTF-8 编码字符理论上可以最多到 6个字节长，但目前全世界的所// 有文字和符号种类加起来也只要编到 4个字节长就够了。// 　　UTF-8 是以 8位（即 1个字节）为单元对原始码进行编码（注意一// 点：这里所讲的原始码都是指Unicode码），并规定：多字节码（2个字// 节以上才称为多字节）以转换后第1个字节起头的连续“1”的数目（这// 些连续“1”称为标记
复制链接

扫一扫

专栏目录

恨天低 CSDN认证博客专家 CSDN认证企业博客

码龄15年

27: 原创

23万+: 周排名

193万+: 总排名

17万+: 访问

: 等级

1828: 积分

101: 粉丝

39: 获赞

22: 评论

62: 收藏

私信

关注

热门文章

分类专栏

算法 7篇
设计模式 7篇
网络编程 14篇
Linux 14篇
C/C++ 6篇
Perl/Python 3篇
数据库 2篇

最新评论

C++插入排序模板
DeathLight095: 你写的代码自己调试过吗？？
Web服务器压力(负载)测试工具
CSDN-Ada助手: 非常感谢您的分享，这篇博客对我来说非常有用。我觉得您可以继续写一篇关于如何使用JMeter进行Web服务器性能测试的技术博文，这样的文章对其他用户也会非常有帮助。下一篇您可以围绕JMeter的具体使用方法、注意事项等方面展开，相信会有更多读者受益。期待您的下一篇文章！为了方便博主创作，提高生产力，CSDN上线了AI写作助手功能，就在创作编辑器右侧哦～（https://mp.csdn.net/edit?utm_source=blog_comment_recall ）诚邀您来加入测评，到此（https://activity.csdn.net/creatActivity?id=10450&utm_source=blog_comment_recall）发布测评文章即可获得「话题勋章」，同时还有机会拿定制奖牌。
LDAP协议介绍
qq_42877938: 内容挺丰富应该很不错，就是排版看着费劲~
基于Html5 websocket和Python的在线聊天室
weixin_43871603 回复恨天低: 45行，keyerror。你们怎么跑起来的
线程条件变量pthread_cond_t
King_Mumumu: good

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。