开源一个高效获得汉子偏旁部首、拼音的python库

最近因为做命名实体识别,需要用到汉子偏旁部首作为一个输入特征,找了很多库都不太理想,决定动手实现一个。

github地址:https://github.com/wangchuan2008888/cn-radical

安装过程十分简单:

$git clone https://github.com/wangchuan2008888/cn-radical.git
$cd cn-radical
$python setup install

或者使用pip

pip install cnradical

使用也非常简单:

from cnradical import Radical, RunOption

radical = Radical(RunOption.Radical)
pinyin = Radical(RunOption.Pinyin)

input = '你好,今天早上吃饭了吗'
radical_out = [radical.trans_ch(ele) for ele in input]
pinyin_out = [pinyin.trans_ch(ele) for ele in input]
print(radical_out)
print(pinyin_out)

radical_out = radical.trans_str(input)
pinyin_out = pinyin.trans_str(input)
print(radical_out)
print(pinyin_out)
目前只在python3.5/python3.6上测试过,如果有需要再其他版本python上使用的,请留言,我会尽快适配。
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值