C# 关于Encoding编码举例UTF8

emplace_back

于 2024-04-03 13:35:26 发布

阅读量404

点赞数 4

分类专栏： C# 文章标签： c#

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_50859743/article/details/137342438

版权

C# 专栏收录该内容

64 篇文章 0 订阅

订阅专栏

在UTF-8编码中，一个字符可能由一个或多个字节组成。每个字节的前几位用于指示该字符需要多少字节来表示。具体来说，UTF-8编码使用以下规则：

如果一个字节的最高位是0，那么它表示一个ASCII字符，并且该字节就是该字符的完整表示。

如果一个字节以110开头，它表示这是一个两字节字符的第一个字节。
如果一个字节以1110开头，它表示这是一个三字节字符的第一个字节。
如果一个字节以11110开头，它表示这是一个四字节字符的第一个字节。
在你提供的byte[] bb数组中：

byte[] bb = { 228, 189, 160, 229, 165, 189 };

228（二进制表示为11100100）是以1110开头的，所以它表示一个三字节字符的第一个字节。
229（二进制表示为11100101）同样是以1110开头的，也表示一个三字节字符的第一个字节。
在你的数组中，228和229都是各自三字节UTF-8字符序列的开始。每个这样的序列都包含三个字节

其中第一个字节表示字符需要多少字节，而后面的字节包含字符的实际编码。

故要正确解码这些字节序列，你需要以三个字节为一组来解读它们。例如：

228, 189, 160 这三个字节一起表示一个UTF-8编码的字符。
229, 165, 189 这三个字节一起表示另一个UTF-8编码的字符。
当你使用Encoding.UTF8.GetString(bb)时，.NET Framework的UTF-8解码器会识别这些字节序列，并将它们转换回对应的Unicode字符，然后这些字符会被组合成一个字符串。

在你的例子中，228, 189, 160 对应的Unicode字符是中，而229, 165, 189 对应的Unicode字符是文。所以，当你显示这个字符串时，你会看到“中文”。

简而言之，228和229在UTF-8编码中的作用是标识三字节字符序列的开始。它们自身并不直接对应任何字符，而是与跟随它们的字节一起，共同表示一个特定的Unicode字符。

注意：

1byte = 8bit

关注

4
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
C# 关于Encoding编码举例UTF8

在UTF-8编码中，一个字符可能由一个或多个字节组成。每个字节的前几位用于指示该字符需要多少字节来表示。具体来说，UTF-8编码使用以下规则：如果一个字节的最高位是0，那么它表示一个ASCII字符，并且该字节就是该字符的完整表示。如果一个字节以110开头，它表示这是一个两字节字符的第一个字节。如果一个字节以1110开头，它表示这是一个三字节字符的第一个字节。如果一个字节以11110开头，它表示这是一个四字节字符的第一个字节。在你提供的byte[] bb（二进制表示为11100100）是以。
复制链接

扫一扫

专栏目录

emplace_back CSDN认证博客专家 CSDN认证企业博客

码龄4年

270: 原创

5478: 周排名

9657: 总排名

11万+: 访问

: 等级

3625: 积分

641: 粉丝

771: 获赞

2: 评论

796: 收藏

私信

关注

热门文章

分类专栏

C# 64篇
MATLAB 8篇
C 13篇
C++ 51篇
Java 8篇
串口 2篇
STM32 19篇
Linux 23篇
VMware 1篇
ACWING 52篇
WIN AND CMD 3篇
Python 1篇
数据结构 4篇
通信 1篇
RK 1篇
OpenCV 6篇
计算机网络 9篇
杂七杂八 6篇

最新评论

C# Task 包含 await ConfigureAwait CancellationTokenSource
全栈小5: 博主这篇文章内容很不错，结构清晰，思维活跃，具有条理性可以借鉴并学习和落地，内容丰富图文详细，认真看完收获很大，学习了，期待博主更多的好文章。支持【C# Task 包含 await ConfigureAwait CancellationTokenSource，博主这篇文章，值得一看】
C# Task 包含 await ConfigureAwait CancellationTokenSource
普通网友: 大佬的文章写的太精辟了让我深刻了解了这篇文章的精髓谢谢大佬分享，希望继续创作优质博文。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。