前言
- 最近需要使用维基百科中文语料做实体链接,内容涉及到繁体和简体之间的转换,这才有了下文
🐛openCC( open chinese convert)
开源的语言转换器,支持转换范围:简明中文,繁体,日语汉字
支持字符级别、短语级别的转换
不是翻译工具
🐛🐛🐛Opencc快速安装
- 百度到前人在使用
pip install OpenCC安装看起来好复杂啊,还各种错误,瞬间劝退。 - 推荐安装 opencc-python-reimplemented,这个是纯python写的包,如果与我相似,只是暂时用到这个包(详细区别我没深究),功能应该类似。
3 秒快速安装命令:
pip install opencc-python-reimplemented
💌使用方式:
from opencc import OpenCC
# "s2t":简体——>繁体,"t2s":繁体——>简体
cc = OpenCC('s2t') # convert from Simplified Chinese to Traditional Chinese
to_convert = '开放中文转换'
converted = cc.convert(to_convert)
转换说明
hk2s: 繁体中文(香港标准)转简体中文
s2hk: 简体中文转繁体中文(香港标准)
s2t: 简体中文转繁体中文
s2tw: 简体中文转换成繁体中文(台湾标准)
s2twp: 简体中文转繁体中文(带短语)
t2hk: 繁体中文转繁体(香港标准)
t2s: 繁体中文转简体
t2tw: 繁体中文转繁体(台湾标准)
tw2s: 繁体中文(台湾标准)转简体中文
tw2sp:繁体中文(台湾标准)转简体中文(带短语)