C++ 宽窄字符与字符集

昵称真难改

已于 2023-10-10 13:36:24 修改

阅读量185

点赞数 1

文章标签： c++

于 2023-10-09 09:51:48 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/LaeHa/article/details/133685119

版权

长度

c++ 中 char 占1字节，而wchar_t占2字节。

一个ansi字符占1个字节

一个unicode字符占2个字节

一个utf-8字符不定长

一个gb2312字符不定长

编码

拿“你好”这两个字来说

如果你的电脑使用gb2312编码

string s = "你好"；

那么字符串的长度为4个字节

二进制为 (11000100 11100011 10111010 11000011)

对应的十进制为 -60 -29 -70 -61

如果你的电脑使用utf8编码

string u = "你好"；

那么字符串长度为6个字节

二进制为 (11100100 10111101 10100000 11100101 10100101 10111101)

对应的十进制为 -28 -67 -96 -27 -91 -67

打印

如果我们使用gb2312的电脑来打印utf8 编码的字符串就会出现乱码。

现在我们复现一下，我这台电脑使用的是gb2312编码 !

int main(int argc, char* argv[]) {	

    char gb2312[5] = { -60,-29,-70,-61,'\0' };
	char utf8[7] = {-28,-67,-96,-27,-91,-67,'\0' };
	cout << gb2312 << endl;
	cout << utf8<<endl;
    return 0;

}

输出

你好
浣犲ソ

显然使用gb2312打印utf8会出现乱码。

转化

你可以把utf8转换成gb2312解决乱码问题，但我认为最好是把这两个种字符全都转成 unicode，因为 unicode 是固定长度的。

unicode 是2个字节， wchar_t 也是2个字节，所以我想你应该明白了。

我们可以使用wchar_t来存储unicode字符，这样就统一了，不管是什么字符都可以存成unicode。

下面代码将utf8 转 unicode 使用wchar_t 存储

#include <codecvt>

int main(int argc, char* argv[]) {	

	char utf8[7] = {-28,-67,-96,-27,-91,-67,'\0' };
    wstring unicode = std::wstring_convert<std::codecvt_utf8<wchar_t>>().from_bytes(utf8);	
	wcout <<unicode<<endl;
    return 0;

}

输出

你好

PS wstring f = L"你好"; c++直接将这两个字符保存为unicode。

昵称真难改

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

昵称真难改 CSDN认证博客专家 CSDN认证企业博客

码龄5年

5: 原创

42万+: 周排名

25万+: 总排名

1万+: 访问

: 等级

90: 积分

27: 粉丝

37: 获赞

3: 评论

92: 收藏

私信

关注

热门文章

最新评论

UE 连续延时触发
CSDN-Ada助手: 恭喜您写完了第5篇博客！标题“UE 连续延时触发”听起来非常有趣。您的持续创作真是令人钦佩！我很期待看到您未来的创作。或许您可以考虑分享一些实际应用场景下的连续延时触发技术，或者探索一些新的创意和想法。无论如何，您的博客已经给读者带来了很多启发和有趣的内容。谢谢您的付出，并期待您下一步的创作！
C++ 宽窄字符与字符集
CSDN-Ada助手: 恭喜您写完了第四篇博客！标题“C++ 宽窄字符与字符集”听起来非常有深度，我很期待阅读您的文章。您对于这个主题的选择让我感到十分兴奋，因为宽窄字符和字符集在C++中是非常重要的概念。希望您能够在文章中详细解释宽窄字符的概念及其在字符集中的应用，这将帮助读者更好地理解和应用C++编程语言。除此之外，如果您能提供一些实际的示例和案例，将有助于读者更好地理解这些概念。期待您下一步的创作，祝您写作顺利！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
Python 实现浮点数range，生成间隔相同的浮点数
太太一轮: 感谢您的分享，非常棒的算法

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。