GB2312汉字编码实现

问题描述:

在很多软件中,输入拼音的首写字母就可以快速定位到某个词条。比如,在铁路售票软件中,输入: “bj”就可以定位到“北京”。怎样在自己的软件中实现这个功能呢?问题的关键

在于:对每个汉字必须能计算出它的拼音首字母。

    GB2312汉字编码方式中,一级汉字的3755个是按照拼音顺序排列的。我们可以利用这个特征,对常用汉字求拼音首字母。

    GB2312编码方案对每个汉字采用两个字节表示。第一个字节为区号,第二个字节为区中的偏移号。为了能与已有的ASCII编码兼容(中西文混排),区号和偏移编号都从

0xA1开始。

    我们只要找到拼音a,b,c,...x,y,z 每个字母所对应的GB2312编码的第一个汉字,就可以定位所有一级汉字的拼音首字母了(不考虑多音字的情况)。下面这个表给出了前述信

息。请你利用该表编写程序,求出常用汉字的拼音首字母。


a 啊 B0A1

b 芭 B0C5

c 擦 B2C1

d 搭 B4EE

e 蛾 B6EA

f 发 B7A2

g 噶 B8C1

h 哈 B9FE

j 击 BBF7

k 喀 BFA6

l 垃 C0AC

m 妈 C2E8

n 拿 C4C3

o 哦 C5B6

p 啪 C5BE

q 期 C6DA

r 然 C8BB

s 撒 C8F6

t 塌 CBFA

w 挖 CDDA

x 昔 CEF4

y 压 D1B9

z 匝 D4D1

#include <iostream>  
#include <string>   
#include <cstring>
using namespace std;  
  
char a[23][3]={"啊","芭","擦","搭","蛾","发","噶","哈","击","喀","垃","妈","拿","哦","啪","期","然","撒","塌","挖","昔","压","匝"};  
char ax[23]={'A','B','C','D','E','F','G','H','J','K','L','M','N','O','P','Q','R','S','T','W','X','Y','Z'};  
  
string solve(string ch)  
{  
    int i,j;  
    string ans;  
	char b[3];  
	b[2]='\0';  
	for(i=0;ch[i]!='\0';i+=2)  
    {  
       b[0]=ch[i];  
       b[1]=ch[i+1];  
       for(j=0;j<22;j++)
           if(strcmp(b,a[j])>=0&&strcmp(b,a[j+1])<0)  
               break;  
       ans+=ax[j];
    }  
    return ans;  
}  
  
int main()  
{  
    string  b="测试案例"; 

	cout<<solve(b)<<endl;  
    return 0;  
}  


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值