最近因为做命名实体识别,需要用到汉子偏旁部首作为一个输入特征,找了很多库都不太理想,决定动手实现一个。
github地址:https://github.com/wangchuan2008888/cn-radical
安装过程十分简单:
$git clone https://github.com/wangchuan2008888/cn-radical.git
$cd cn-radical
$python setup install
或者使用pip
pip install cnradical
使用也非常简单:
from cnradical import Radical, RunOption
radical = Radical(RunOption.Radical)
pinyin = Radical(RunOption.Pinyin)
input = '你好,今天早上吃饭了吗'
radical_out = [radical.trans_ch(ele) for ele in input]
pinyin_out = [pinyin.trans_ch(ele) for ele in input]
print(radical_out)
print(pinyin_out)
radical_out = radical.trans_str(input)
pinyin_out = pinyin.trans_str(input)
print(radical_out)
print(pinyin_out)
目前只在python3.5/python3.6上测试过,如果有需要再其他版本python上使用的,请留言,我会尽快适配。