关于汉字与Ascii码

转载 2012年03月22日 10:51:27

GB2312和GBK每一个汉字由2个字节组成,这2个字节的ASCII码大小分别是:
gb2312:

high8 = 0xa1-->0xfe (161 - 254)
low8 = 0xa1-->0xfe  (161 - 254)

gbk:

high8 = 0x80-->0xfe (128 - 254)
low8 = 0x40-->0xfe (64 - 254)

 

GB2312和GBK的区别:http://zhidao.baidu.com/question/40269499

 

汉字ASCII对照表的打印方法:

  1. // 打印ASCII汉字编码表   
  2. for(int i =  129; i < 256; ++i) //  129 = 0x81     
  3. {  
  4.     for(int j = 64; j < 256; ++j) // 64 = 0x40   
  5.     {  
  6.     char pchar[3];  
  7.     pchar[0] = i;  
  8.     pchar[1] = j;  
  9.     pchar[2] = '/0';  
  10.     cout << pchar << " " << i << "," << j << " ";  
  11.     }  
  12. }  

知道一个汉字,输出其ASCII码:

  1. //  知道一个汉字,获取其ASCII编码   
  2. char * pchar = "中";  
  3. //需要先把pchar的每个字符转成unsigned char,   
  4. // 直接用int i = pchar[0],得到的是负值   
  5. unsigned char ci = pchar[0];   
  6. int i = ci;  
  7. unsigned char cj = pchar[1];  
  8. int j = cj;  
  9. cout << pchar << " " << i << "," << j << endl;  
  10. // 输出214,208  

知道汉字的ASCII码,输出汉字:

 

  1. //  知道汉字的ASCII码输出汉字   
  2. char pchar[3];  
  3. pchar[0] = 214;  
  4. pchar[1] = 208;  
  5. pchar[2] = '/0';  
  6. cout << pchar << endl; 

应用,去除文件中除汉字、字母、数字以外的字符:

 

  1. // 去除文件中除汉字、字母、数字以外的字符   
  2. // 文件必须是ANSI编码   
  3. CString sFile = readLocalFile(sname);  
  4. char * pTemp = sFile.GetBuffer();  
  5. CString stoWrite = "";  
  6. for(int i = 0; i < strlen(pTemp); ++i)  
  7. {  
  8.     int ch = pTemp[i];  
  9.     if(ch < 0)  
  10.     {  
  11.          //  使用unsigned char 读取可以获取128 - 255 之间的数值   
  12.         unsigned char c = pTemp[i];    
  13.         int itemp = c;  
  14.                 // 范围选择170 - 254是为了去掉中文标点及其他字符,范围请参考汉字ASCII对照表   
  15.         if(itemp >= 170 && itemp <= 254)  
  16.         {  
  17.             char * pchar = new char[3];  
  18.             pchar[2] = '/0';  
  19.             pchar[0] = pTemp[i];  
  20.                 pchar[1] = pTemp[i+1];  
  21.             //cout << pchar;   
  22.             stoWrite += pchar;  
  23.             delete [] pchar;  
  24.         }  
  25.         // 此时(ch < 0)两个char表示一个汉字,所以跳过第二个char   
  26.         ++i;      
  27.     }  
  28.     else if( (ch >= 97 && ch <= 122) || (ch >= 48 && ch <= 57))  
  29.     {  
  30.         //cout << pTemp[i];   
  31.         stoWrite += pTemp[i];  
  32.     }  
  33. }  
  34. writeLocalFile(stoWrite, rname);  

 

 

 

相关文章推荐

C++ 文件的复制、删除、重命名

一、文件的复制 #include #include using namespace std; int CopyFile(char *SourceFile,char *NewFile) {...

Java中文与ASCII码的转换

今天在研究Java中编码的时候,看到了Java中ascii码的强大。写了一个CoderUtils.java,以后会扩展它。  package com.xingxd.study.test;import ...

汉字的ASCII码对照表

1,汉字ASCII对照表的打印方法; 2,知道一个汉字,输出其ASCII码; 3,知道汉字的ASCII码,输出汉字; 4,应用,去除文件中除汉字、字母、数字以外的字符。
  • hdflj
  • hdflj
  • 2010-09-09 10:34
  • 15060

黑马程序员之 C#学习笔记:关于json在客户端解析汉字为ASCII码的解析

在.NET中,ReferenceEquals()方法是专门用来表示引用相等的; ==运算符和Equals()方法都可以用来表示引用相等和值相等。对于值类型而言, ==和Equals()方法是一样的,...

点阵字体 ASCII码 汉字库 自我学习 简单总结

学习各种大小点阵字体显示,参考网上资料,简单记录一下!

native2ascii Java的一个文件转码工具(properties文件汉字转换)

native2ascii.exe 是 Java 的一个文件转码工具,是将特殊各异的内容转为用指定的编码标准文体形式统一的表现出来,它通常位于 JDK_home\bin 目录下,安装好 Java SE ...

汉字编码与编程相关问题总结:ASCII、机内码、区位码、国标码、Unicode码是如何转换的

一、ASCII、机内码、区位码、国标码、Unicode码他们之间是如何转换的,方程式是什么 汉字系统中的过程包括区位码、国标码和机内码,其中的转换关系如下: 1.区位码(十进制)转换成区位...
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:深度学习:神经网络中的前向传播和反向传播算法推导
举报原因:
原因补充:

(最多只允许输入30个字)