python实现中文语义网_Python实现中文转化为对应的拼音以及拼音转化为相应的中文...

729de0e6935324a4fd3e0150155546d3.png

由于项目的需求,在使用中文和汉语拼音的转化,自己写了一个版本,感觉很low,本质上就是读数据库,闲来查了一下,居然还真的有这样现成的库,就拿来使用一下吧,代码很简单,就是觉得挺有意思的,下面的样例代码,喜欢玩的可以拿去试试:

#!usr/bin/env python#encoding:utf-8from __future__ import division  '''__Author__:沂水寒城功能:汉字与拼音的转化'''  import sysfrom xpinyin import Pinyin from Pinyin2Hanzi import DefaultDagParamsfrom Pinyin2Hanzi import dag reload(sys)sys.setdefaultencoding("utf-8")   def hanzi_to_pinyin(one_str,flag=''): ''' 将汉字转化为对应的拼音 ''' translator=Pinyin() one_kw_pinyin=translator.get_pinyin(unicode(one_str), flag).strip() print '{0} Pinyin is: {1}'.format(one_str.decode('utf-8'),one_kw_pinyin) return one_kw_pinyin  def pinyin_to_hanzi(pinyin,Topk=5): ''' 拼音转化为汉字 汉字存在多意性,所以这里没有一一对应的关系,只能选出概率最高的topk ''' translator=DefaultDagParams() result=dag(translator,pinyin,path_num=Topk,log=True) for item in result: socre=item.score # 得分 res=item.path # 转换结果 print socre, ''.join([one.decode('utf-8') for one in res])     if __name__ == '__main__': one_str=u"今天我们从哈尔滨工业大学毕业了" one_pinyin=hanzi_to_pinyin(one_str,flag='')   one_pinyin_list=['jin','tian','wo','men','bi','ye','le'] pinyin_to_hanzi(one_pinyin_list,Topk=5)  one_pinyin_list=['jin','tian','wo','men','cong','ha','gong','da','bi','ye','le'] pinyin_to_hanzi(one_pinyin_list,Topk=5)

结果如下:

今天我们从哈尔滨工业大学毕业了 Pinyin is: jintianwomenconghaerbingongyedaxuebiyele-2.6794233796 今天我们毕业了-4.5275475027 今天我们毕业了-4.73691227283 今天我们毕业乐-4.78472579465 今天我们毕业勒-4.78840427787 今天我们毕业肋-6.54485608597 今天我们从哈工大毕业了-6.58379180427 今天我们聪哈工大毕业了-6.58383547606 今天我们匆哈工大毕业了-6.58493875469 今天我们丛哈工大毕业了-6.58684225671 今天我们葱哈工大毕业了[Finished in 1.6s]
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值