关于汉字与Ascii码

GB2312和GBK每一个汉字由2个字节组成,这2个字节的ASCII码大小分别是:
gb2312:

high8 = 0xa1-->0xfe (161 - 254)
low8 = 0xa1-->0xfe  (161 - 254)

gbk:

high8 = 0x80-->0xfe (128 - 254)
low8 = 0x40-->0xfe (64 - 254)

 

GB2312和GBK的区别:http://zhidao.baidu.com/question/40269499

 

汉字ASCII对照表的打印方法:

  1. // 打印ASCII汉字编码表   
  2. for(int i =  129; i < 256; ++i) //  129 = 0x81     
  3. {  
  4.     for(int j = 64; j < 256; ++j) // 64 = 0x40   
  5.     {  
  6.     char pchar[3];  
  7.     pchar[0] = i;  
  8.     pchar[1] = j;  
  9.     pchar[2] = '/0';  
  10.     cout << pchar << " " << i << "," << j << " ";  
  11.     }  
  12. }  

知道一个汉字,输出其ASCII码:

  1. //  知道一个汉字,获取其ASCII编码   
  2. char * pchar = "中";  
  3. //需要先把pchar的每个字符转成unsigned char,   
  4. // 直接用int i = pchar[0],得到的是负值   
  5. unsigned char ci = pchar[0];   
  6. int i = ci;  
  7. unsigned char cj = pchar[1];  
  8. int j = cj;  
  9. cout << pchar << " " << i << "," << j << endl;  
  10. // 输出214,208  

知道汉字的ASCII码,输出汉字:

 

  1. //  知道汉字的ASCII码输出汉字   
  2. char pchar[3];  
  3. pchar[0] = 214;  
  4. pchar[1] = 208;  
  5. pchar[2] = '/0';  
  6. cout << pchar << endl; 

应用,去除文件中除汉字、字母、数字以外的字符:

 

  1. // 去除文件中除汉字、字母、数字以外的字符   
  2. // 文件必须是ANSI编码   
  3. CString sFile = readLocalFile(sname);  
  4. char * pTemp = sFile.GetBuffer();  
  5. CString stoWrite = "";  
  6. for(int i = 0; i < strlen(pTemp); ++i)  
  7. {  
  8.     int ch = pTemp[i];  
  9.     if(ch < 0)  
  10.     {  
  11.          //  使用unsigned char 读取可以获取128 - 255 之间的数值   
  12.         unsigned char c = pTemp[i];    
  13.         int itemp = c;  
  14.                 // 范围选择170 - 254是为了去掉中文标点及其他字符,范围请参考汉字ASCII对照表   
  15.         if(itemp >= 170 && itemp <= 254)  
  16.         {  
  17.             char * pchar = new char[3];  
  18.             pchar[2] = '/0';  
  19.             pchar[0] = pTemp[i];  
  20.                 pchar[1] = pTemp[i+1];  
  21.             //cout << pchar;   
  22.             stoWrite += pchar;  
  23.             delete [] pchar;  
  24.         }  
  25.         // 此时(ch < 0)两个char表示一个汉字,所以跳过第二个char   
  26.         ++i;      
  27.     }  
  28.     else if( (ch >= 97 && ch <= 122) || (ch >= 48 && ch <= 57))  
  29.     {  
  30.         //cout << pTemp[i];   
  31.         stoWrite += pTemp[i];  
  32.     }  
  33. }  
  34. writeLocalFile(stoWrite, rname);  

 

 

 

  • 1
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值