汉字拼音对照库

在项目中需要实现用户输入拼音就能查找到汉字的功能,在网上搜索了一下汉字和对应的拼音的库,发现很少,找到的几个收录的汉字也就几千个常用字。所以自己收集整理了一个。希望对大家有帮助。

我提供的这个库是我自己收录的,共计2万多个汉字。我以文本文件的方式共享给大家。

文本文件中的内容和格式如下:

 

每行记录是一个汉字,同音字有几个音就有几行。

每行格式说明:汉字,拼音,声母,韵母,unicode编码(16进制),频率

 

关于最后一列的频率有3个值,0代表一般字,1代表常用字,2代表最常用的百家姓。

这个值主要是针对多音字,因为有的读音不常见,所以用这个值来决定汉字具体选用的读音。

当然,这最后一列是我后期根据项目的需要自己定义的频率值,因为我们这个项目是录入拼音查找姓名的,所以把百家姓的频率值设置的最高,那样在对用户姓名进行拼音编码时吻合的概率就高一些。

关于声母和韵母有些字不一定正确,例如“安”,这个字的拼音是“an”,它没有声母,但是我也把它的声母定义为“a“,因为输入拼音的时候通常用户输入的就是声母,例如“王安石”录入的是“was",这个也是根据实际的项目需求这样做的。

 

总之,这个对照库的“汉字”“拼音”“unicode编码”3列是肯定正确的,“声母”“韵母”和“频率”是根据实际需要定义的。

 

不也可以根据自己项目的需要来重新处理或定义它们。

这个库是直接从sql server2000中导出的txt文件,在使用时也可以重新导回到sql

 

库的下载地址:http://download.csdn.net/source/1926342

 

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值