用拼音首字符序列来实现检索功能


作者:正安一片瓦 日期:2005-11-19
字体大小: 小 中 大 
---- 在日常工作和生活中我们经常使用电子记事本查找个人通讯录信息,或在单
位的应用程序中查询客户档案或业务资料,这个过程中往往需要输入大量的汉字
信息,对于熟悉计算机的人这已经是一件头疼的事,那些不太熟悉计算机或根本
不懂汉字输入的用户简直就望而生畏。作为对数据检索技术的一种新的尝试,作
者探索使用汉字拼音的首字符序列作为检索关键字,这样,用户不必使用汉字,
只须简单地键入要查询信息的每个汉字的拼音首字符即可。比如你想查找关键字
“中国人民银行”,你只需要输入“zgrmyh”。作者希望通过下面的例子,为广
大计算机同行起一个抛砖引玉的作用,让我们开发的程序更加便捷、好用。 

---- 原理很简单,找出汉字表中拼音首字符分别为“A”至“Z”的汉字内码范围
,这样,对于要检索的汉字只需要检查它的内码位于哪一个首字符的范围内,就
可以判断出它的拼音首字符。 

---- 程序更简单,包括3个控件:一个列表存放着所有待检索的信息;一个列表
用于存放检索后的信息;一个编辑框用于输入检索关键字(即拼音首字符序列)
。详细如下: 

---- 1.进入Delphi创建一个新工程:Project1 

---- 2.在Form1上创建以下控件并填写属性: 

控件类型      属性名称  属性值
Edit           Name      Search
ListBox        Name      SourceList
Items      输入一些字符串,如姓名等,用于提供检索数据
ListBox        Name      ResultList

---- 3.键入以下两个函数 
// 获取指定汉字的拼音索引字母,如:“汉”的索引字母是“H”
function GetPYIndexChar( hzchar:string):char;
begin
  case WORD(hzchar[1]) shl 8 + WORD(hzchar[2]) of
    $B0A1..$B0C4 : result := 'A';
    $B0C5..$B2C0 : result := 'B';
    $B2C1..$B4ED : result := 'C';
    $B4EE..$B6E9 : result := 'D';
    $B6EA..$B7A1 : result := 'E';
    $B7A2..$B8C0 : result := 'F';
    $B8C1..$B9FD : result := 'G';
    $B9FE..$BBF6 : result := 'H';
    $BBF7..$BFA5 : result := 'J';
    $BFA6..$C0AB : result := 'K';
    $C0AC..$C2E7 : result := 'L';
    $C2E8..$C4C2 : result := 'M';
    $C4C3..$C5B5 : result := 'N';
    $C5B6..$C5BD : result := 'O';
    $C5BE..$C6D9 : result := 'P';
    $C6DA..$C8BA : result := 'Q';
    $C8BB..$C8F5 : result := 'R';
    $C8F6..$CBF9 : result := 'S';
    $CBFA..$CDD9 : result := 'T';
    $CDDA..$CEF3 : result := 'W';
    $CEF4..$D188 : result := 'X';
    $D1B9..$D4D0 : result := 'Y';
    $D4D1..$D7F9 : result := 'Z';
  else
    result := char(0);
  end;
end;

// 在指定的字符串列表SourceStrs中检索符合拼音索引字符串
PYIndexStr的所有字符串,并返回。
function SearchByPYIndexStr
( SourceStrs:TStrings;
PYIndexStr:string):string;
label NotFound;
var
  i, j   :integer;
  hzchar :string;
begin
  for i:=0 to SourceStrs.Count-1 do
    begin
      for j:=1 to Length(PYIndexStr) do
        begin
          hzchar:=SourceStrs[i][2*j-1] 
+ SourceStrs[i][2*j];
          if (PYIndexStr[j]<>'?') and
(UpperCase(PYIndexStr[j]) <>
GetPYIndexChar(hzchar)) then goto NotFound;
        end;
      if result='' then result := SourceStrs[i]
      else result := result + Char
(13) + SourceStrs[i];
NotFound:
    end;
end;

4.增加编辑框Search的OnChange事件:
procedure TForm1.SearchChange(Sender: TObject);
var ResultStr:string;
begin
  ResultStr:='';
  ResultList.Items.Text := SearchByPYIndexStr
(Sourcelist.Items, Search.Text);
end; 

---- 5.编译运行后,在编辑框Search中输入要查询字符串的拼音首字符序列,
检索结果列表ResultList就会列出检索到的信息,检索中还支持“?”通配符,
对于难以确定的的文字使用“?”替代位置,可以实现更复杂的检索。 


转载自『大雪飞歌-正安一片瓦的博客』http://blog.gzza.com

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值