c语言null和space,Null-terminated multibyte strings

以空字符结尾的多字节字符串(NTMBS)或“多字节字符串”是一个非零字节序列,后跟一个值为零的字节(终止空字符)。

存储在该字符串中的每个字符可占用多于一个字节。 用于表示多字节字符串中字符的编码是特定于语言环境的:它可以是UTF-8,GB18030,EUC-JP,Shift-JIS等。例如,字符数组{'\ xe4','\ xbd ','\ xa0','\ xe5','\ xa5','\ xbd','\ 0'}是以UTF-8多字节编码形式存储字符串“你好”的NTMBS:前三个字节编码字符【你】,接下来的三个字节编码字符【好】。 在GB18030中编码的字符串是字符数组{'\ xc4','\ xe3','\ xba','\ xc3','\ 0'},其中两个字符中的每一个都被编码为一个双字节 序列。

在某些多字节编码中,任何给定的多字节字符序列都可能表示不同的字符,这取决于先前的字节序列,称为“移位序列”。这种编码被称为状态依赖:需要了解当前的转换状态来解释每个字符。NTMBS只有在开始和结束于初始转换状态时才有效:如果使用移位序列,则相应的非移位序列必须存在于终止空字符之前。这种编码的例子是BOCU-1和SCSU。

多字节字符串与空字符串字符串(NTBS)是布局兼容的,也就是说,除了计算字符数外,可以使用相同的工具来存储,复制和检查。如果正确的语言环境有效,I / O函数还处理多字节字符串。使用以下与区域设置相关的转换函数,可以将多字节字符串转换为宽字符串并从中转换为宽字符串:

多字节/宽字符转换

| 在头文件中定义 |

|:----|

| mblen | 返回下一个多字节字符(函数)中的字节数|

| mbtowc | 将下一个多字节字符转换为宽字符(函数)|

| wctombwctomb_s(C11)| 将宽字符转换为其多字节表示(函数)|

| mbstowcsmbstowcs_s(C11)| 将窄多字节字符串转换为宽字符串(函数)|

| wcstombswcstombs_s(C11)| 将宽字符串转换为窄多字节字符串(函数)|

| 在头文件中定义 |

| mbsinit(C95)| 检查mbstate_t对象是否代表初始转换状态(函数)|

| btowc(C95)| 如果可能的话将单字节窄字符扩展为宽字符(函数)|

| wctob(C95)| 如果可能,则将宽字符缩小为单字节窄字符|(函数)

| mbrlen(C95)| 返回给定状态(函数)下一个多字节字符的字节数|

| mbrtowc(C95)| 将下一个多字节字符转换为宽字符,给定状态(函数)|

| wcrtombwcrtomb_s(C95)(C11)| 将宽字符转换为其多字节表示,给定状态(函数)|

| mbsrtowcsmbsrtowcs_s(C95)(C11)| 将一个窄的多字节字符串转换为宽字符串,给定状态(函数)|

| wcsrtombswcsrtombs_s(C95)(C11)| 将宽字符串转换为窄多字节字符串,给定状态(函数)|

| 在头文件中定义 |

| mbrtoc16(C11)| 从一个窄多字节字符串(函数)生成下一个16位宽字符 |

| c16rtomb(C11)| 将16位宽字符转换为窄多字节字符串(函数)|

| mbrtoc32(C11)| 从一个窄多字节字符串(函数)生成下一个32位宽字符|

| c32rtomb(C11)| 将32位宽字符转换为窄多字节字符串(函数)|

类型

| 在头文件中定义 |

|:----|

| mbstate_t(C95)| 转换多字节字符串(类)所需的转换状态信息|

| 在头文件中定义 |

| char16_t(C11)| 16位宽字符类型(typedef)|

| char32_t(C11)| 32位宽字符类型(typedef)|

| 在头文件中定义 |

|:----|

| MB_LEN_MAX | 对于任何受支持的语言环境(宏常量),多字节字符中的最大字节数|

| 在头文件 中定义|

| MB_CUR_MAX | 当前语言环境(宏变量)中多字节字符中的最大字节数|

| 在头文件中定义 |

| __STDC_UTF_16__(C11)| 表示mbrtoc16和c16rtomb(宏常量)使用UTF-16编码|

| __STDC_UTF_32__(C11)| 指示由mbrtoc32和c32rtomb(宏常量)使用UTF-32编码|

参考

C11标准(ISO / IEC 9899:2011):7.10整数类型的大小(p:222)

7.22常用工具(p:340-360)

7.28 Unicode实用程序(p:398-401)

7.29扩展的多字节和宽字符实用程序(p:402-446)

7.31.12通用工具(p:456)

7.31.16扩展的多字节和宽字符实用程序(p:456)

K.3.6通用工具(p:604-614)

K.3.9扩展的多字节和宽字符实用程序(p:627-651)

C99标准(ISO / IEC 9899:1999):7.10整数类型的大小(p:203)

7.20通用工具(p:306-324)

7.24扩展的多字节和宽字符实用程序(p:348-392)

7.26.10通用工具(p:402)

7.26.12扩展的多字节和宽字符实用程序(p:402)

C89 / C90标准(ISO / IEC 9899:1990):4.1.4限制和

4.10一般实用程序

4.13.7通用工具

扩展内容

| 用于Null终止的多字节字符串的C ++文档 |

|:----|

本文档系腾讯云云+社区成员共同维护,如有问题请联系 yunjia_community@tencent.com

在头文件中定义int iswdigit(wint_t ch);(自C95以来)

检查给定的宽字符是否对应(如果缩小)十个十进制数字字符0123456789中的一个。

参数

CH-宽字符

返回值

如果宽字符是数字字符,则为非零值,否则为零。

注意

iswdigit与iswxdigit是唯一不受当前安装的C语言环境影响的标准宽字符分类函数。

一些语言环境提供了检测非ASCII数字的附加字符类。

#include #include #include #include  void test(wchar_t a3, wchar_t u3, wchar_t j3){    printf("        '%lc' '%lc' '%lc'\n", a3, u3, j3);    printf("iswdigit %d    %d   %d\n",           !!iswdigit(a3), !!iswdigit(u3), !!iswdigit(j3));    printf("jdigit:  %d    %d   %d\n", !!iswctype(a3, wctype("jdigit")),          !!iswctype(u3, wctype("jdigit")),          !!iswctype(j3, wctype("jdigit")));}

int main(void){

wchar_t a3 = L'3';  // the ASCII digit 3

wchar_t u3 = L'三'; // the CJK numeral 3

wchar_t j3 = L'3'; // the fullwidth digit 3

setlocale(LC_ALL, "en_US.utf8");    puts("In American locale:");    test(a3, u3, j3);

setlocale(LC_ALL, "ja_JP.utf8");    puts("\nIn Japanese locale:");    test(a3, u3, j3);}

输出:

In American locale:        '3' '三' '3'iswdigit 1    0   0jdigit:  0    0   0

In Japanese locale:        '3' '三' '3'iswdigit 1    0   0jdigit:  0    0   1

参考

C11标准(ISO / IEC 9899:2011):7.30.2.1.5 iswdigit函数(p:449)

C99标准(ISO / IEC 9899:1999):7.25.2.1.5 iswdigit函数(p:395)

扩展内容

isdigit检查一个字符是否是一个数字(功能)

| 用于iswdigit的C ++文档 |

ASCII 值  (十六进制)字符iscntrl  iswcntrl.isprint  iswprint.isspace  iswspace.isblank  iswblank.isgraph  iswgraph.ispunct  iswpunct.isalnum  iswalnum.isalpha  iswalpha.isupper  iswupper.islower  iswlower.isdigit  iswdigit.isxdigit  iswxdigit.0 - 80x00-0x08控制码 (NUL, etc.)≠000000000000

90x09tab (\t)≠00≠0≠000000000

10 - 130x0A-0x0D空格 (\n,\v,\f,\r)≠00≠0000000000

14 - 310x0E-0x1F控制码≠000000000000

320x20space0≠0≠0≠000000000

33 - 470x21-0x2F!"#$%&'()*+,-./0≠000≠0≠0000000

48 - 570x30-0x3901234567890≠000≠00≠0000≠0≠0

58 - 640x3a-0x40:;<=>?@0≠000≠0≠0000000

65 - 700x41-0x46ABCDEF0≠000≠00≠0≠0≠000≠0

71 - 900x47-0x5AGHIJKLMNOPQRSTUVWXYZ0≠000≠00≠0≠0≠0000

91 - 960x5B-0x60[]^_` | 0 | ≠0 | 0 | 0 | ≠0 | ≠0 | 0 | 0 | 0 | 0 | 0 | 0 |

97 -1020x61-0x66abcdef0≠000≠00≠0≠00≠00≠0

103-1220x67-0x7Aghijklmnopqrstuvwxyz0≠000≠00≠0≠00≠000

123-1260x7B-0x7E{|}~0≠000≠0≠0000000

1270x7F退格 (DEL)≠000000000000

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
提供的源码资源涵盖了安卓应用、小程序、Python应用和Java应用等多个领域,每个领域都包含了丰富的实例和项目。这些源码都是基于各自平台的最新技术和标准编写,确保了在对应环境下能够无缝运行。同时,源码中配备了详细的注释和文档,帮助用户快速理解代码结构和实现逻辑。 适用人群: 这些源码资源特别适合大学生群体。无论你是计算机相关专业的学生,还是对其他领域编程感兴趣的学生,这些资源都能为你提供宝贵的学习和实践机会。通过学习和运行这些源码,你可以掌握各平台开发的基础知识,提升编程能力和项目实战经验。 使用场景及目标: 在学习阶段,你可以利用这些源码资源进行课程实践、课外项目或毕业设计。通过分析和运行源码,你将深入了解各平台开发的技术细节和最佳实践,逐步培养起自己的项目开发和问题解决能力。此外,在求职或创业过程中,具备跨平台开发能力的大学生将更具竞争力。 其他说明: 为了确保源码资源的可运行性和易用性,特别注意了以下几点:首先,每份源码都提供了详细的运行环境和依赖说明,确保用户能够轻松搭建起开发环境;其次,源码中的注释和文档都非常完善,方便用户快速上手和理解代码;最后,我会定期更新这些源码资源,以适应各平台技术的最新发展和市场需求。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值