Locale:标准库字符编码转换概览.（从C++17开始弃用)

最新推荐文章于 2024-04-18 08:30:00 发布

weixin_34404393

最新推荐文章于 2024-04-18 08:30:00 发布

阅读量1.6k

点赞数

文章标签： c/c++ python

原文链接：https://my.oschina.net/SHIHUAMarryMe/blog/776575

版权

2019独角兽企业重金招聘Python工程师标准>>>

C++标准库也提供了字符转换的工具:

但是只要要求可以实现以下几种转换，需要注意的事这些都是针对std::codecvt的特例化版本.

std::codecvt<char, char, std::mbstate_t> : 该版本的一般用于 UTF-8和ASCII(8bit)之间的转换.

std::codecvt<char16_t, char, std::mbstate_t>: 该版本的一般用于 UTF-16和UTF-8之间的转换.

std::codecvt<char32_t, char, std::mbstate_t>: 该版本的一般用于 UTF32和UTF-8之间的转换.

std::codecvt<wchar_t, char, std::mbstate_t>: 该版本的一般用于当前系统原生的wchar_t字符集和多字节字符集（multibyte characterset）之间的转换.

std::codecvt是依赖std::locale的，如果你使用的当前标准库有实现对对扩展字符集(Extented UNIX Code)的支持那么我们可以很容易使用std::codecvt转换进行 Unicode字符集和扩展字符集之间的转换.

在此之前我们需要了解一个 trivial-class：std::mbstate_t这个类很特殊，例如----采用multibyte编码的时候，在这种情况下在处理一个字符的时候，可能由于“源缓冲区”已经空了，或者目标缓冲区满了造成multibyte字符处理中断。如果这种情况出现将当前转换状态存储到此类对象内.

在了解std::codecvt之前我们需要再明确一个概念:

源缓冲区: 存储需要被转换的字符的区域.

目标缓冲区：存储已经被转换的字符的区域.

当从 wchar_t到char的时候:

会将每个wchar_t切割为 sizeof(wchar_t)个char对象.

当从char到wchar_t的时候:

会用sizeof(wchar_t)个char组装成一个char.

因此无论是下面的in()操作还是out()操作都只是切割或者组装操作，并不是到直接的把一个其他字符集的字符映射到当前字符集（反之亦然）.

其中有几个

最低0.47元/天解锁文章

weixin_34404393

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
Locale:标准库字符编码转换概览.（从C++17开始弃用)

2019独角兽企业重金招聘Python工程师标准>>> ...
复制链接

扫一扫

weixin_34404393 CSDN认证博客专家 CSDN认证企业博客

码龄8年

136: 原创

-: 周排名

44万+: 总排名

125万+: 访问

: 等级

7233: 积分

4182: 粉丝

224: 获赞

24: 评论

1064: 收藏

私信

关注

热门文章

最新评论

原码,补码
做而论道_CS: 计算机，有 8 位机、16 位机、...。每次运算，也就只用到 8、16 位二进制数。而且，计算机中，也只有加法器。那么，45－45 = 0，八位机将如下计算：　　0010 1101 + xxxx xxxx = 0000 0000。其中的：xxxx xxxx，就是【－45 的八位补码】。这个补码，到底是什么？你自己也能推导出来。先移项：xxxx xxxx = 0000 0000－0010 1101，可得出：xxxx xxxx = (借位 1) 1101 0011，取八位：xxxx xxxx = 1101 0011。至此，就求出了 [－45]补 = 1101 0011。求负数的补码，就是这么简单！
原码,补码
做而论道_CS: 其实，补码的原理，与 “取反加一” 毫无关系。补码的来源，可以用十进制来说明。假定，只使用两位数：0~99。此时，－1 就可以用 +99 代替。如：24－1 = 23 　　24 + 99 = (一百) 23 忽略进位，只取两位，这两种算法，功能相同。三角函数中，也有：－90° 与＋270° 等效。重点：　限定位数（或范围）后，数值变化就有了周期性。　正数（补码），就可以代表负数；　加法，就可以代替减法。因此：　学会了加法，就可走遍天下。
原码,补码
做而论道_CS: 码长八位时，各码的范围如下。原码：－127 ~ +127。反码：－127 ~ +127。补码：－128 ~ +127。注意：－128，没有原码反码，只有补码。没有原码，拿什么取反？没有反码，拿什么加一？
原码,补码
做而论道_CS: 码长八位时，各码的范围如下。原码：－127 ~ +127。反码：－127 ~ +127。补码：－128 ~ +127。注意：－128，没有原码反码，只有补码。没有原码，拿什么取反？没有反码，拿什么加一？其实，补码的原理，与 “取反加一” 毫无关系。补码的来源，可以用十进制来说明。假定，只使用两位数：0~99。此时，－1 就可以用 +99 代替。如：24－1 = 23 　　24 + 99 = (一百) 23 忽略进位，只取两位，这两种算法，功能相同。三角函数中，也有：－90° 与＋270° 等效。【限定位数（或范围）后，数值变化就有了周期性。】　正数（补码），就可以代表负数；　加法，就可以代替减法。　因此，学会了加法运算，就可走遍天下。计算机，有 8 位机、16 位机。每次运算，也就只用到 8、16 位二进制数。而且，计算机中，只有加法器。那么，45－45 = 0，八位机将如下计算：　　0010 1101 + xxxx xxxx = 0000 0000。其中的：xxxx xxxx，就是【－45 的八位补码】。这个补码，到底是什么？你自己也能推导出来。先移项：xxxx xxxx = 0000 0000－0010 1101，可得出：xxxx xxxx = (借位 1) 1101 0011，取八位：xxxx xxxx = 1101 0011。至此，就求出了 [－45]补 = 1101 0011。求负数的补码，就是这么简单！－－－－－－－－－－－－－－－－－实际上，任意负数（－X）的补码，都是：0 － X。你用二进制简单算一下，立刻就能得到结果。（－128 的 8 位补码，也就是这样求出来的。）同理，任意正数（＋X）的补码，也都是：0 ＋ X。 0 ＋ X，不就是 X 吗？即，正数的补码，就是 X 本身！－－－－－－－－－－－－－－－－－在现代计算机中，只有加法器，只能使用补码。所以，在计算机中，只有补码，并没有原码和反码。不存在的东西，学它干嘛呢？计算机老师，指望这个混饭吃呗。顺便，再抓几个不及格的，抖一下威风！真值机器数符号位原码反码取反加一符号位不变模同余 ... 专家写的这些，明显就是【拿个鞋拔子当做玉如意】。假货，不仅仅在古董行业才有啊！
WPF特效-实现弧形旋转轮播图
sadfasdfsadf: 兄弟有源码吗分享下

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。