java unicode 和string_std :: string和UTF-8编码的unicode

最新推荐文章于 2023-05-10 21:50:41 发布

weixin_39709178

最新推荐文章于 2023-05-10 21:50:41 发布

阅读量132

点赞数

文章标签： java unicode 和string

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39709178/article/details/114961224

版权

你在谈论Unicode . Unicode使用32位来表示字符 . 然而，由于这会浪费内存，因此存在更紧凑的编码 . UTF-8就是这样一种编码 . 它假定您使用字节单位并将Unicode字符映射到1,2,3或4个字节 . UTF-16是另一种使用单词作为单位并将Unicode字符映射到1或2个字(2或4个字节)的UTF-16 . 您可以同时使用string和wchar_t进行编码 . 对于英文文本/数字，UTF-8往往更紧凑 .

无论使用哪种编码和类型(比较)，有些东西都会起作用 . 但是，所有需要理解一个角色的功能都将被破坏 . 即第5个字符并不总是底层数组中的第5个字符 . 它可能看起来像是在使用某些示例，但它最终会破坏 . string :: compare可以工作，但不希望按字母顺序排序 . 这取决于语言 . string :: find_first_of适用于某些但不是全部 . 长字符串可能只是因为它们很长而较短，而较短字符串可能会被字符对齐混淆并产生非常难以发现的错误 .

最好的办法是找到一个为你处理它的库，并忽略下面的类型(除非你有充分的理由选择其中一个) .

weixin_39709178

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
java unicode 和string_std :: string和UTF-8编码的unicode

你在谈论Unicode . Unicode使用32位来表示字符 . 然而，由于这会浪费内存，因此存在更紧凑的编码 . UTF-8就是这样一种编码 . 它假定您使用字节单位并将Unicode字符映射到1,2,3或4个字节 . UTF-16是另一种使用单词作为单位并将Unicode字符映射到1或2个字(2或4个字节)的UTF-16 . 您可以同时使用string和wchar_t进行编码 . 对于...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。