![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
字符编码
文章平均质量分 70
0x0005
这个作者很懒,什么都没留下…
展开
-
C/C++字符乱码研究
字符串显示到UI界面上大致有三个阶段:源文件编码格式、编译存储编码格式、执行编码格式1,源文件编码格式我们的C/C++源文件一般有GBK、UNICODE(UTF8、UTF16、UTF32)等编码格式,其中UTF8分为带BOM和不带BOM,BOM其实就是标记双字节或者四字节字符是大端还是小端存储,所以其实UTF8是不需要BOM标记的。VC编译器不认不带BOM的UTF8文件,也就是VC编译器会...原创 2019-02-19 09:53:59 · 1721 阅读 · 0 评论 -
C++11指定字符串常量编码格式
C++11字符串换初始化方式char16_t* p1 = u"中国";//把字符串初始化为UTF16字符串存储char32_t* p2 = U"中国";//把字符串初始化为UTF32字符串存储wchar_t* p3 = L"中国";//win是UCS2码下等同UTF16字符串,Linxu是UCS4码下等同utf32字符串char* p4 = u8"中国";//把字符串初始化...原创 2019-02-19 15:53:03 · 4643 阅读 · 2 评论 -
UCS和UTF
UCS-2和UCS-4Unicode是为整合全世界的所有语言文字而诞生的。任何文字在Unicode中都对应一个值, 这个值称为代码点(code point)。代码点的值通常写成 U+ABCD 的格式。 而文字和代码点之间的对应关系就是UCS-2(Universal Character Set coded in 2 octets)。 顾名思义,UCS-2是用两个字节来表示代码点,其取值范围为 U...转载 2019-02-19 14:53:51 · 826 阅读 · 0 评论