关于汉字与Ascii码

转载 2012年03月22日 10:51:27

GB2312和GBK每一个汉字由2个字节组成,这2个字节的ASCII码大小分别是:
gb2312:

high8 = 0xa1-->0xfe (161 - 254)
low8 = 0xa1-->0xfe  (161 - 254)

gbk:

high8 = 0x80-->0xfe (128 - 254)
low8 = 0x40-->0xfe (64 - 254)

 

GB2312和GBK的区别:http://zhidao.baidu.com/question/40269499

 

汉字ASCII对照表的打印方法:

  1. // 打印ASCII汉字编码表   
  2. for(int i =  129; i < 256; ++i) //  129 = 0x81     
  3. {  
  4.     for(int j = 64; j < 256; ++j) // 64 = 0x40   
  5.     {  
  6.     char pchar[3];  
  7.     pchar[0] = i;  
  8.     pchar[1] = j;  
  9.     pchar[2] = '/0';  
  10.     cout << pchar << " " << i << "," << j << " ";  
  11.     }  
  12. }  

知道一个汉字,输出其ASCII码:

  1. //  知道一个汉字,获取其ASCII编码   
  2. char * pchar = "中";  
  3. //需要先把pchar的每个字符转成unsigned char,   
  4. // 直接用int i = pchar[0],得到的是负值   
  5. unsigned char ci = pchar[0];   
  6. int i = ci;  
  7. unsigned char cj = pchar[1];  
  8. int j = cj;  
  9. cout << pchar << " " << i << "," << j << endl;  
  10. // 输出214,208  

知道汉字的ASCII码,输出汉字:

 

  1. //  知道汉字的ASCII码输出汉字   
  2. char pchar[3];  
  3. pchar[0] = 214;  
  4. pchar[1] = 208;  
  5. pchar[2] = '/0';  
  6. cout << pchar << endl; 

应用,去除文件中除汉字、字母、数字以外的字符:

 

  1. // 去除文件中除汉字、字母、数字以外的字符   
  2. // 文件必须是ANSI编码   
  3. CString sFile = readLocalFile(sname);  
  4. char * pTemp = sFile.GetBuffer();  
  5. CString stoWrite = "";  
  6. for(int i = 0; i < strlen(pTemp); ++i)  
  7. {  
  8.     int ch = pTemp[i];  
  9.     if(ch < 0)  
  10.     {  
  11.          //  使用unsigned char 读取可以获取128 - 255 之间的数值   
  12.         unsigned char c = pTemp[i];    
  13.         int itemp = c;  
  14.                 // 范围选择170 - 254是为了去掉中文标点及其他字符,范围请参考汉字ASCII对照表   
  15.         if(itemp >= 170 && itemp <= 254)  
  16.         {  
  17.             char * pchar = new char[3];  
  18.             pchar[2] = '/0';  
  19.             pchar[0] = pTemp[i];  
  20.                 pchar[1] = pTemp[i+1];  
  21.             //cout << pchar;   
  22.             stoWrite += pchar;  
  23.             delete [] pchar;  
  24.         }  
  25.         // 此时(ch < 0)两个char表示一个汉字,所以跳过第二个char   
  26.         ++i;      
  27.     }  
  28.     else if( (ch >= 97 && ch <= 122) || (ch >= 48 && ch <= 57))  
  29.     {  
  30.         //cout << pTemp[i];   
  31.         stoWrite += pTemp[i];  
  32.     }  
  33. }  
  34. writeLocalFile(stoWrite, rname);  

 

 

 

汉字的ASCII码对照表

1,汉字ASCII对照表的打印方法; 2,知道一个汉字,输出其ASCII码; 3,知道汉字的ASCII码,输出汉字; 4,应用,去除文件中除汉字、字母、数字以外的字符。...
  • hdflj
  • hdflj
  • 2010年09月09日 10:34
  • 15948

js 中文汉字、Unicode、ASCII互相转换函数代码

Unicode介绍 Unicode(统一码、万国码、单一码)是一种在计算机上使用的字符编码。 Unicode 是为了解决传统的字符编码方案的局限而产生的,它为每种语言中的每个字符设定了统一并且唯一...
  • sinat_24876999
  • sinat_24876999
  • 2017年05月08日 23:16
  • 1007

ASCII与中文互转

我们在开发使时常会用到资源文件,这可能是为了多语言、国际化的需要,也可能是使用了国外开源项目的原因,这就需要中文转ascii将中文转换为 ASCII 编码,或者将 ASCII 转换为中文,那么我...
  • java_min
  • java_min
  • 2012年08月23日 10:58
  • 8272

汉字ASCII码表

  • 2013年02月19日 12:11
  • 204KB
  • 下载

Java中文与ASCII码的转换

今天在研究Java中编码的时候,看到了Java中ascii码的强大。写了一个CoderUtils.java,以后会扩展它。  package com.xingxd.study.test;import ...
  • xxd851116
  • xxd851116
  • 2009年03月11日 17:22
  • 47181

ASCII码值中文对照表

  • 2014年03月14日 10:02
  • 204KB
  • 下载

c# 汉字转换成ASCII码及ASCII码转换成汉字代码

ASCII码本身并不支持中国的汉字,那么我们需要将汉字转换成对应的16进制码,然后取出对应的ASCII16进制码组成汉字编码。 string str = "中华人民共和国"; //这里我们将采用2...
  • Andrewniu
  • Andrewniu
  • 2017年05月23日 15:06
  • 2365

Ascii完整码表(256个)

ASCII码表 ASCII值 控制字符 ASCII值 控制字符 ASCII值 控制字符 ASCII值 控制字...
  • ttmice
  • ttmice
  • 2016年03月25日 11:23
  • 17838

ASCII 完整的码表。1~255个码,均有,而且带中文解释

  • 2013年11月15日 15:33
  • 43KB
  • 下载

关于汉字与Ascii码

GB2312和GBK每一个汉字由2个字节组成,这2个字节的ASCII码大小分别是: gb2312: high8 = 0xa1-->0xfe (161 - 254) low8 = 0xa1-->...
  • ColdKevin
  • ColdKevin
  • 2012年03月22日 10:51
  • 14158
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:关于汉字与Ascii码
举报原因:
原因补充:

(最多只允许输入30个字)