C++标准里 string和wstring

C++标准里 string和wstring

分类: c++/stl   524人阅读  评论(0)  收藏  举报
c++

在C++标准里定义了两个字符串string和wstring 


typedef basic_string<char> string; 

typedef basic_string<wchar_t> wstring; 


      前者string是常用类型,可以看作char[],其实这正是与string定义中的
_Elem=char相一致。而wstring,使用的是wchar_t类型,这是宽字符,用于满足非ASCII字符的要求,例如Unicode编码,中文,日文,韩文什么的。对于wchar_t类型,实际上C++中都用与char函数相对应的wchar_t的函数,因为他们都是从同一个模板类似于上面的方式定义的。因此也有wcout, wcin, werr等函数。      实际上string也可以使用中文,但是它将一个汉字写在2个char中。而如果将一个汉字看作一个单位wchar_t的话,那么在wstring中就只占用一个单元,其它的非英文文字和编码也是如此。这样才真正的满足字符串操作的要求,尤其是国际化等工作。 
     看一下下面的程序,就会理解两者的差别。
  1. #include <iostream>   
  2. #include <string>   
  3. using namespace std;  
  4.   
  5. #define tab "\t"    
  6.   
  7. int main()   
  8. {   
  9.     locale def;   
  10.     cout<<def.name()<<endl;  
  11.     locale current = cout.getloc();  
  12.     cout<<current.name()<<endl;    
  13.   
  14.     float val=1234.56;      cout<<val<<endl;   
  15.   
  16.     //chage to french/france   
  17.     cout.imbue(locale("chs"));  
  18.     current=cout.getloc();   
  19.     cout<<current.name()<<endl;  
  20.     cout<<val<<endl;    
  21.   
  22.     //上面是说明locale的用法,下面才是本例的内容,因为其中用到了imbue函数  
  23.     cout<<"*********************************"<<endl;    
  24.   
  25.     //为了保证本地化输出(文字/时间/货币等),chs表示中国,wcout必须使用本地化解析编码   
  26.     wcout.imbue(std::locale("chs"));    
  27.   
  28.     //string 英文,正确颠倒位置,显示第二个字符正确   
  29.     string str1("ABCabc");   
  30.     string str11(str1.rbegin(),str1.rend());   
  31.     cout<<"UK\ts1\t:"<<str1<<tab<<str1[1]<<tab<<str11<<endl;    
  32.   
  33.     //wstring 英文,正确颠倒位置,显示第二个字符正确  
  34.     wstring str2=L"ABCabc";   
  35.     wstring str22(str2.rbegin(),str2.rend());   
  36.     wcout<<"UK\tws4\t:"<<str2<<tab<<str2[1]<<tab<<str22<<endl;   
  37.   
  38.     //string 中文,颠倒后,变成乱码,第二个字符读取也错误   
  39.     string str3("你好么?");   
  40.     string str33(str3.rbegin(),str3.rend());   
  41.     cout<<"CHN\ts3\t:"<<str3<<tab<<str3[1]<<tab<<str33<<endl;    
  42.   
  43.     //正确的打印第二个字符的方法   
  44.     cout<<"CHN\ts3\t:RIGHT\t"<<str3[2]<<str3[3]<<endl;    
  45.   
  46.     //中文,正确颠倒位置,显示第二个字符正确   
  47.     wstring str4=L"你好么?";   
  48.     wstring str44(str4.rbegin(),str4.rend());   
  49.     wcout<<"CHN\tws4\t:"<<str4<<tab<<str4[1]<<tab<<str44<<endl;   
  50.   
  51.     //只有char类型的string时才可以如此构造  
  52.     wstring str5(str1.begin(),str1.end());   
  53.     wstring str55(str5.rbegin(),str5.rend());   
  54.     wcout<<"CHN\tws5\t:"<<str5<<tab<<str5[1]<<tab<<str55<<endl;  
  55.   
  56.     //如此构造将失败!!!!  
  57.     wstring str6(str3.begin(),str3.end());   
  58.     wstring str66(str6.rbegin(),str6.rend());   
  59.     wcout<<"CHN\tws6\t:"<<str6<<tab<<str6[1]<<tab<<str66<<endl;   
  60.   
  61.     return 0;  
  62. }  


上面显示了本地化的作用,是在数字中每三位加一个逗号,其实对时间/文字等都是用影响的。 
     下面的输出说明了,如何正确使用string和wstring的方法。第三个因为使用string来表示汉字,出现了一些错误。最后一行也是错误,导致了输出也受到了影响,没有空格与回车。(最后两个就不要管中英文了,仅仅说明一下中文构造方法是错误的) 
     《掌握标准C++类》在第十二章《语言支持》中专门讲C++的国际化和本地化问题,C++提供了I18N的标准处理,软件开发者可以参考。        C++标准库还是非常博大精深的,功能比较齐全的。继续学习。

#include <iostream>
#include <string>
#include <locale>
#include <codecvt>
#include <fstream>

int main(int argc, char *argv[])
{
   std::wstring str = L"123,我是谁?我爱钓鱼岛!";

   std::wstring_convert<std::codecvt_utf8<wchar_t>> conv;

   std::string narrowStr = conv.to_bytes(str);
   {
      std::ofstream ofs ("c:\\test.txt");
      ofs << narrowStr;
   }

   std::wstring wideStr = conv.from_bytes(narrowStr);
   {
      std::locale::global(std::locale("Chinese-simplified"));
      std::wofstream ofs (L"c:\\testW.txt");
      ofs << wideStr;
   }

来自: http://hi.baidu.com/janvyking999/blog/item/fd5d44df572c3c5c94ee37de.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值