C/C++语言中的字符类型
存在两种表示字符的基本类型:
- char:一个字节8bit表示,最多表示256个字符,表示和用来处理ASCII字符集,国际通用
- wchar_t:多字节字符表示,典型2个字节或者4个字节,如GNU libc中为4B,可以表示更多的字符,满足国际化应用开发的需求,实现标准
在开发中ASCII编码字符都是用char来表示,可以转换成wchar_t表示;wchar_t类型与Unicode编码是完全独立的概念,不过在实现上Unicode编码一般用wchar_t来表示实现而已,但wchar_t字符并不一定就是Unicode编码字符。
对应两种字符类型存在两种字符串类型(C++):
- string: char字符列表或者是字节列表(bytes)
- wstring: wchar_t字符列表或者是宽子节列表
对应两种字符类型的输出函数流对象有:
- sprintf/wsprintf: 分别对应char与wchar_t
- cout/wcout:分别对