C++中汉字与unicode码的转换

最新推荐文章于 2024-01-26 16:12:26 发布

chzms

最新推荐文章于 2024-01-26 16:12:26 发布

阅读量1.4w

点赞数

分类专栏： C++技术漫漫编程路文章标签： c++ string 存储

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/chzms/article/details/2720996

版权

C++技术同时被 2 个专栏收录

5 篇文章 0 订阅

订阅专栏

漫漫编程路

3 篇文章 0 订阅

订阅专栏

已知一个汉字的unicode码（例如－２０３１９），可以通过以下方法得到该unicode码对应的汉字：

１，声明一个３字节长的字符数组，例如char a[3]；

２，对该数组赋值为char a[3]={unsigned(-20319)/256,unsigned(-20319)%256,0};

３，输出直接为cout<<a<<endl;即可；

４，也可以把字符数组直接赋值给字符串string，例如string str(a);。

下面对步骤２进行解释，unicode码为１６位（unsigned short），而字符char类型仅有８位，步骤２完成的功能就是把unicode前８位和后８位分别存放在一个字符数组不同的２字节中，由此可以想像，char型的字符串存储汉字时也应该是这样的。结尾的０表示数组的结束。

查一个汉字的unicode码更简单，声明一个wchar_t变量，并直接赋值一个汉字，例如wchar_t ch='阿';，显示时直接cout<<ch<<endl;即可。不过编译时可能给警告。输出的文件中和普通操作一样。

关注

0
点赞
踩
7

收藏

觉得还不错? 一键收藏
1
评论
C++中汉字与unicode码的转换

已知一个汉字的unicode码（例如－２０３１９），可以通过以下方法得到该unicode码对应的汉字：１，声明一个３字节长的字符数组，例如char a[3]；２，对该数组赋值为char a[3]={unsigned(-20319)/256,unsigned(-20319)%256,0}; ３，输出直接为cout
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。