UTF8编码

kv110

于 2021-11-09 22:42:05 发布

阅读量472

点赞数

分类专栏： CJava 文章标签： UTF8

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/kv110/article/details/121237964

版权

CJava 专栏收录该内容

42 篇文章 1 订阅

订阅专栏

这篇博客深入探讨了UTF8编码的细节，包括它如何使用1到4个字节表示不同类型的字符，如ASCII码、拉丁文、中日韩文字等。文章通过示例代码展示了检查UTF8字节序列正确性的方法，例如在`CheckUtfBytes`函数中对连续字节的验证。

摘要由CSDN通过智能技术生成

UTF8使用1-4个字节表示一个字符

一个字节 00-7F ASCII码0-127

二个字节C0-DF 拉丁文等欧洲文字，阿拉伯文

三个字节E0-EF 中日韩朝文字东南亚文字

四个字节F0-FF

编码格式

0xxxxxxx
110xxxxx 10xxxxxx （0x80-0xDF)
1110xxxx 10xxxxxx 10xxxxxx
11110xxx 10xxxxxx 10xxxxxx 10xxxxxx
111110xx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx
1111110x 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx

/art/runtime/jni/check_jni.cc
CheckUtfBytes(const char* bytes, const char** errorKind)

if ((*utf8 & 0xc0) != 0x80) {
*errorKind = "continuation";
return utf8;
}

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

kv110 CSDN认证博客专家 CSDN认证企业博客

码龄17年

218: 原创

3万+: 周排名

4万+: 总排名

72万+: 访问

: 等级

7907: 积分

188: 粉丝

160: 获赞

73: 评论

860: 收藏

私信

关注

热门文章

分类专栏

FileSystem
Android 89篇
Assembly 9篇
CJava 42篇
Device driver 15篇
Linux 49篇
Mobile 8篇
TCP/IP 7篇
USB 24篇
Bluetooth 24篇
WiFi 40篇
Audio 2篇

最新评论

synchronized 和Lock区别
不管怎么都要开心: lock 不是悲观的吗？
synchronized 和Lock区别
Dikz12: 博主的文章细节很到位，兼顾实用性和可操作性，感谢博主的分享，文章思路清晰，干货满满，很有学习价值！值得学习！(=￣ω￣=)
Android P WIFI启动流程梳理
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性；(2)增加条理清晰的目录。
macbook上使用gdb
BlackConcrete: 补充一下，我的电脑执行之后还不行，查了下网上资料，需要创建一个 XML文件（见另一条评论），然后执行如下命令：其中 gdb_key.xml 是你的 XML 文件路径、gdb_key是你的钥匙串名字， [code=html] codesign --entitlements gdb_key.xml -fs gdb_key $(which gdb) [/code]
macbook上使用gdb
BlackConcrete: [code=html] <?xml version="1.0" encoding="UTF-8"?> <!DOCTYPE plist PUBLIC "-//Apple//DTD PLIST 1.0//EN" "http://www.apple.com/DTDs/PropertyList-1.0.dtd"> <plist version="1.0"> <dict> <key>com.apple.security.cs.debugger</key> <true/> </dict> </plist> [/code]

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。