C++ 汉字的编码简例

最新推荐文章于 2020-03-20 05:14:40 发布

u010634308

最新推荐文章于 2020-03-20 05:14:40 发布

阅读量5k

点赞数 1

分类专栏： C++

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u010634308/article/details/53032451

版权

C++ 专栏收录该内容

6 篇文章 0 订阅

订阅专栏

1、c风格字符串char数组存储时采用【多字节字符集】存储，英文字符（0-127）采用ASCⅡ编码，汉字采用GBK编码，用2个字节表示（不分大小端）。

多字节字符集（MBCS）是在ASCⅡ基础上演变过来（为了兼容西方特殊字符，东方汉字日文等），名称中的“多字节”是相对于之前的单字节编码而言的。

2、标准库string也采用多字节字符集存储，同上；

3、wchar_t是C++中专门用来存储宽字符的类型，前缀L是将【多字节字符集】转化为【宽字符集（unicode）】。

Unicode为地球上(以后会包括火星，金星，喵星等)每种语言中的每个字符设定了统一并且唯一的二进制编码（0-65535，2Byte），以满足跨语言、跨平台进行文本转换、处理的要求。在Unicode中，汉字“字”对应的数字是23383。在Unicode中，我们有很多方式将数字23383表示成程序中的数据，包括：UTF-8、UTF-16等（其中UTF-16为标准Unicode编码，UTF-8是为了Unicode能在单字节字符集机器上应用演变出来的）。UTF是“UCS Transformation Format”的缩写，可以翻译成Unicode字符集转换格式，即怎样将Unicode定义的数字转换成程序数据。
本例中“顺”的UTF-16编码为0x987a，内存中为小端存储（低字节靠前）。

参考：

1、点击打开链接中文编码杂谈

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
C++ 汉字的编码简例

1、c风格字符串char数组存储时采用【多字节字符集】存储，英文字符（0-127）采用ASCⅡ编码，汉字采用GBK编码，用2个字节表示（不分大小端）2、标准库string也采用多字节字符集存储，同上；3、wchar_t是C++中专门用来存储宽字符的类型，前缀L是将【多字节字符集】转化为【宽字符集（unicode）】。Unicode为地球上(以后会包括火星，金星，喵星等)每种语言中的每个
复制链接

扫一扫

专栏目录

目录

分类专栏

C#
Winform
WPF
Halcon 2篇
C++ 6篇
VS 3篇
mfc 7篇

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。