最近项目中用到了简单的简繁转换,如果用OpenCC
太重了,于是搜到了 zhconv 这个库。
zhconv 提供基于 MediaWiki 词汇表的最大正向匹配简繁转换,Python 2, 3 通用。
支持以下地区词转换:
zh-tw
台灣正體zh-hk
香港繁體zh-sg
马新简体zh-hans
简体zh-hant
繁體
正好适合我不求转换质量的轻量需求,所以介绍给更多需要的人。
而且虽然该项目stars很少,但中途发现作者还参与过维护jieba分词。
调用也非常简单
>>> from zhconv import convert
>>> convert('Python是一种动态的、面向对象的脚本语言', 'zh-hant')
'Python是一種動態的、面向對象的腳本語言'
复制代码
支持对地区化词语的转换
>>> convert('计算机软件', 'zh-tw')
'計算機軟體'
>>> convert('計算機軟體', 'zh-hans') # zh-hans只是逐字转换
'计算机软体&