VS2008 Unicode和多字节编码区别

最新推荐文章于 2022-07-31 11:36:28 发布

SurgePing

最新推荐文章于 2022-07-31 11:36:28 发布

阅读量6.5k

点赞数 1

分类专栏： C/C++ 文章标签： unicode utf8 多字节编码编码转换

本文链接：https://blog.csdn.net/suxinpingtao51/article/details/17533573

版权

C/C++ 专栏收录该内容

90 篇文章 4 订阅

订阅专栏

unicode和多字节字符集是两种不同的编码方式，不同的编码方式下，所对应的一些函数是不兼容的。

一种编码格式，Unicode 2个字节表示所有的字符，多字节是一个字节表示英文，两个就表示汉字

如果你新的工程是Unicode的，就用Unicode开发，摒弃多字节编码，多字节编码弊端太多了。
其实改起来很简单，你把所有的char都改成TCHAR，如果能用CString，尽量用CString。所有字符串函数都换上带_t的版本，比如_tsprintf()、_tcscpy之类的……因为这些东西都是同时兼容Unicode和ANSI的，所以改起来很容易。

工程到底会以哪种编码方式去编码，是根据根据“项目属性”中配置的预编译宏UNICODE来决定的。

STL里面的string，封装的是单字节字符，由于其跨平台的特性，任何支持标准C++的平台都可以使用它，需要字符转换时转换即可。建议多使用std::string。

==============================

unicode和UTF-8的关系

unicode 是一种编码表格，例如，给一个汉字规定一个代码。类似 GB2312-1980, GB18030等，只不过字集不同。 

一个unicode码可能转成长度为一个BYTE,或两个，三个，四个BYTE的UTF8码，取决于unicode码的值。

而英文unicode码因为值小于0x80,只要用一个BYTE的UTF8传送，比传输unicode两个BYTEs快。 
UTF8并不是一种编码方式，而只是一种传送和存储的格式。是为传输unicode而想出来的“再编码”方法罢了。

其实没有太大的区别，只是在作网站时，那些网页文本一般要保存为utf-8，这样就不会出现乱码。

多字节编码与UTF8编码的转换，请参考：http://www.doc88.com/p-182436917988.html

SurgePing

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录