关于汉字与Ascii码

转载 2012年03月22日 10:51:27

GB2312和GBK每一个汉字由2个字节组成,这2个字节的ASCII码大小分别是:
gb2312:

high8 = 0xa1-->0xfe (161 - 254)
low8 = 0xa1-->0xfe  (161 - 254)

gbk:

high8 = 0x80-->0xfe (128 - 254)
low8 = 0x40-->0xfe (64 - 254)

 

GB2312和GBK的区别:http://zhidao.baidu.com/question/40269499

 

汉字ASCII对照表的打印方法:

  1. // 打印ASCII汉字编码表   
  2. for(int i =  129; i < 256; ++i) //  129 = 0x81     
  3. {  
  4.     for(int j = 64; j < 256; ++j) // 64 = 0x40   
  5.     {  
  6.     char pchar[3];  
  7.     pchar[0] = i;  
  8.     pchar[1] = j;  
  9.     pchar[2] = '/0';  
  10.     cout << pchar << " " << i << "," << j << " ";  
  11.     }  
  12. }  

知道一个汉字,输出其ASCII码:

  1. //  知道一个汉字,获取其ASCII编码   
  2. char * pchar = "中";  
  3. //需要先把pchar的每个字符转成unsigned char,   
  4. // 直接用int i = pchar[0],得到的是负值   
  5. unsigned char ci = pchar[0];   
  6. int i = ci;  
  7. unsigned char cj = pchar[1];  
  8. int j = cj;  
  9. cout << pchar << " " << i << "," << j << endl;  
  10. // 输出214,208  

知道汉字的ASCII码,输出汉字:

 

  1. //  知道汉字的ASCII码输出汉字   
  2. char pchar[3];  
  3. pchar[0] = 214;  
  4. pchar[1] = 208;  
  5. pchar[2] = '/0';  
  6. cout << pchar << endl; 

应用,去除文件中除汉字、字母、数字以外的字符:

 

  1. // 去除文件中除汉字、字母、数字以外的字符   
  2. // 文件必须是ANSI编码   
  3. CString sFile = readLocalFile(sname);  
  4. char * pTemp = sFile.GetBuffer();  
  5. CString stoWrite = "";  
  6. for(int i = 0; i < strlen(pTemp); ++i)  
  7. {  
  8.     int ch = pTemp[i];  
  9.     if(ch < 0)  
  10.     {  
  11.          //  使用unsigned char 读取可以获取128 - 255 之间的数值   
  12.         unsigned char c = pTemp[i];    
  13.         int itemp = c;  
  14.                 // 范围选择170 - 254是为了去掉中文标点及其他字符,范围请参考汉字ASCII对照表   
  15.         if(itemp >= 170 && itemp <= 254)  
  16.         {  
  17.             char * pchar = new char[3];  
  18.             pchar[2] = '/0';  
  19.             pchar[0] = pTemp[i];  
  20.                 pchar[1] = pTemp[i+1];  
  21.             //cout << pchar;   
  22.             stoWrite += pchar;  
  23.             delete [] pchar;  
  24.         }  
  25.         // 此时(ch < 0)两个char表示一个汉字,所以跳过第二个char   
  26.         ++i;      
  27.     }  
  28.     else if( (ch >= 97 && ch <= 122) || (ch >= 48 && ch <= 57))  
  29.     {  
  30.         //cout << pTemp[i];   
  31.         stoWrite += pTemp[i];  
  32.     }  
  33. }  
  34. writeLocalFile(stoWrite, rname);  

 

 

 

ASCII码中文对照表

ASCII码表,以备后用 啊:21834 阿:38463 埃:22467 挨:25384 哎:21710 唉:21769 哀:21696 皑:30353 癌:30284 蔼:34108矮:307...
  • yzh54ak
  • yzh54ak
  • 2013年05月27日 12:29
  • 23817

Delphi7高级应用开发随书源码

  • 2003年04月30日 00:00
  • 676KB
  • 下载

字符编码(ASCII、ANSI、GB2312、UTF-8等)系统梳理

引言 在显示器上看见的文字、图片等信息在电脑里面其实并不是我们看见的样子,即使你知道所有信息都存储在硬盘里,把它拆开也看不见里面有任何东西,只有些盘片。假设,你用显微镜把盘片放大,会看见盘片表面凹凸不...

烦人的 One or more breakpoints cannot be set and have been disabled.……

 在VC6.0里面调试的时候,有时候会出现下面这条警告:One or more breakpoints cannot be set and have been disabled.   Executio...

Eclipse vs. IDEA快捷键对比大全

本文转载自【原创】Eclipse vs. IDEA快捷键对比大全 花了一天时间熟悉IDEA的各种操作,将各种快捷键都试了一下,感觉很是不错!于是就整理了一下我经常用的一些Eclipse快捷键与...
  • yx0914
  • yx0914
  • 2014年03月16日 15:28
  • 844

汉字转换成ASCII码.html

  • 2013年10月12日 08:39
  • 2KB
  • 下载

汉字、拼音、ASCII码的转换

package com; import java.util.Iterator;import java.util.LinkedHashMap;import java.util.Set; public...

点阵字体 ASCII码 汉字库 自我学习 简单总结

学习各种大小点阵字体显示,参考网上资料,简单记录一下!

黑马程序员之 C#学习笔记:关于json在客户端解析汉字为ASCII码的解析

在.NET中,ReferenceEquals()方法是专门用来表示引用相等的; ==运算符和Equals()方法都可以用来表示引用相等和值相等。对于值类型而言, ==和Equals()方法是一样的,...
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:关于汉字与Ascii码
举报原因:
原因补充:

(最多只允许输入30个字)