c++11 标准模板(STL)本地化库 - 平面类别(std::codecvt) - 在字符编码间转换,包括 UTF-8、UTF-16、UTF-32 (六)

本地化库

本地环境设施包含字符分类和字符串校对、数值、货币及日期/时间格式化和分析,以及消息取得的国际化支持。本地环境设置控制流 I/O 、正则表达式库和 C++ 标准库的其他组件的行为。

平面类别

在字符编码间转换,包括 UTF-8、UTF-16、UTF-32

std::codecvt
template<

    class InternT,
    class ExternT,
    class State

> class codecvt;

std::codecvt 封装字符串的转换,包括宽和多字节,从一种编码到另一种。通过 std::basic_fstream<CharT> 进行的所有 I/O 操作都使用流中感染的 std::codecvt<CharT, char, std::mbstate_t> 本地环境平面。

继承图

标准库提供以下独立(本地环境无关)特化:

定义于头文件 <locale>

std::codecvt<char, char, std::mbstate_t>恒等转换
std::codecvt<char16_t, char, std::mbstate_t>在 UTF-16 和 UTF-8 间转换 (C++11 起)(C++20 中弃用)
std::codecvt<char16_t, char8_t, std::mbstate_t>在 UTF-16 和 UTF-8 间转换 (C++20 起)
std::codecvt<char32_t, char, std::mbstate_t>在 UTF-32 和 UTF-8 间转换 (C++11 起)(C++20 中弃用)
std::codecvt<char32_t, char8_t, std::mbstate_t>在 UTF-32 和 UTF-8 间转换 (C++20 起)
std::codecvt<wchar_t, char, std::mbstate_t>在系统原生宽和单字节窄字符集间转换

另外, C++ 程序中构造每个的 locale 对象实现其自身的四个特化的( locale 限定)版本。

成员类型

成员类型定义
intern_typeInternT
extern_typeExternT
state_typeState

调用 do_always_noconv & 测试平面编码是否对所有合法值为恒等转换

std::codecvt<InternT,ExternT,State>::always_noconv,
std::codecvt<InternT,ExternT,State>::do_always_noconv

public:
bool always_noconv() const throw();

(1)(C++11 前)

public:
bool always_noconv() const noexcept;

(C++11 起)

protected:
virtual bool do_always_noconv() const throw();

(2)(C++11 前)

protected:
virtual bool do_always_noconv() const noexcept;

(C++11 起)

1) 公开成员函数,调用最终导出类的成员函数 do_always_noconv

2) 若 do_in() 和 do_out() 对于所有合法输入都返回 std::codecvt_base::noconv 则返回 true 。

返回值

若此转换平面不进行转换则为 true ,否则为 false 。

不转换特化 std::codecvt<char, char, std::mbstate_t> 返回 true 。

注意

此函数可用于例如 std::basic_filebuf::underflow 和 std::basic_filebuf::overflow 的实现,以使用大量元素复制取代调用 std::codecvt::in 或 std::codecvt::out ,若已知 std::basic_filebuf 中感染的本地环境不进行任何转换。

调用示例 linux

#include <locale>
#include <iostream>

int main()
{
    std::cout << "The non-converting char<->char codecvt::always_noconv() returns "
              << std::boolalpha
              << std::use_facet<std::codecvt<char, char, std::mbstate_t>>(
                  std::locale()
              ).always_noconv() << std::endl
              << "while wchar_t<->char codecvt::always_noconv() returns "
              << std::use_facet<std::codecvt<wchar_t, char, std::mbstate_t>>(
                  std::locale()
              ).always_noconv() << std::endl;

    return 0;

}

输出

The non-converting char<->char codecvt::always_noconv() returns true
while wchar_t<->char codecvt::always_noconv() returns false

调用示例 window

#include <locale>
#include <iostream>
#include <vector>
#include <Windows.h>
#include <string>

std::vector<std::wstring> locals;

BOOL CALLBACK MyFuncLocaleEx(LPWSTR pStr, DWORD dwFlags, LPARAM lparam)
{
    locals.push_back(pStr);
    return TRUE;
}

std::string stows(const std::wstring& ws)
{
    std::string curLocale = setlocale(LC_ALL, NULL); // curLocale = "C";
    setlocale(LC_ALL, "chs");
    const wchar_t* _Source = ws.c_str();
    size_t _Dsize = 2 * ws.size() + 1;
    char *_Dest = new char[_Dsize];
    memset(_Dest, 0, _Dsize);
    wcstombs(_Dest, _Source, _Dsize);
    std::string result = _Dest;
    delete[]_Dest;
    setlocale(LC_ALL, curLocale.c_str());
    return result;
}

int main()
{
    EnumSystemLocalesEx(MyFuncLocaleEx, LOCALE_ALTERNATE_SORTS, NULL, NULL);

    for (std::vector<std::wstring>::const_iterator str = locals.begin();
            str != locals.end(); ++str)
    {
        std::wcout << *str ;
        std::cout << " codecvt::always_noconv() returns "
                  << std::boolalpha
                  << std::use_facet<std::codecvt<char, char, std::mbstate_t>>(
                      std::locale(stows(*str))
                  ).always_noconv() << std::endl
                  << "while wchar_t<->char codecvt::always_noconv() returns "
                  << std::use_facet<std::codecvt<wchar_t, char, std::mbstate_t>>(
                      std::locale(stows(*str))
                  ).always_noconv() << std::endl;
    }

    return 0;
}

输出

de-DE_phoneb      codecvt::always_noconv() returns true
while wchar_t<->char codecvt::always_noconv() returns false
es-ES_tradnl      codecvt::always_noconv() returns true
while wchar_t<->char codecvt::always_noconv() returns false
hu-HU_technl      codecvt::always_noconv() returns true
while wchar_t<->char codecvt::always_noconv() returns false
ja-JP_radstr      codecvt::always_noconv() returns true
while wchar_t<->char codecvt::always_noconv() returns false
ka-GE_modern      codecvt::always_noconv() returns true
while wchar_t<->char codecvt::always_noconv() returns false
x-IV_mathan      codecvt::always_noconv() returns true
while wchar_t<->char codecvt::always_noconv() returns false
zh-CN_phoneb      codecvt::always_noconv() returns true
while wchar_t<->char codecvt::always_noconv() returns false
zh-CN_stroke      codecvt::always_noconv() returns true
while wchar_t<->char codecvt::always_noconv() returns false
zh-HK_radstr      codecvt::always_noconv() returns true
while wchar_t<->char codecvt::always_noconv() returns false
zh-MO_radstr      codecvt::always_noconv() returns true
while wchar_t<->char codecvt::always_noconv() returns false
zh-MO_stroke      codecvt::always_noconv() returns true
while wchar_t<->char codecvt::always_noconv() returns false
zh-SG_phoneb      codecvt::always_noconv() returns true
while wchar_t<->char codecvt::always_noconv() returns false
zh-SG_stroke      codecvt::always_noconv() returns true
while wchar_t<->char codecvt::always_noconv() returns false
zh-TW_pronun      codecvt::always_noconv() returns true
while wchar_t<->char codecvt::always_noconv() returns false
zh-TW_radstr      codecvt::always_noconv() returns true
while wchar_t<->char codecvt::always_noconv() returns false

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值