opencc中文维基wiki百科简体繁体之间的转换解决

前言

  • 最近需要使用维基百科中文语料做实体链接,内容涉及到繁体和简体之间的转换,这才有了下文

🐛openCC( open chinese convert)

开源的语言转换器,支持转换范围:简明中文,繁体,日语汉字

支持字符级别、短语级别的转换

不是翻译工具

🐛🐛🐛Opencc快速安装

  • 百度到前人在使用 pip install OpenCC 安装看起来好复杂啊,还各种错误,瞬间劝退。
  • 推荐安装 opencc-python-reimplemented,这个是纯python写的包,如果与我相似,只是暂时用到这个包(详细区别我没深究),功能应该类似。

3 秒快速安装命令:

pip install opencc-python-reimplemented

在这里插入图片描述

💌使用方式:

from opencc import OpenCC
# "s2t":简体——>繁体,"t2s":繁体——>简体
cc = OpenCC('s2t')  # convert from Simplified Chinese to Traditional Chinese
to_convert = '开放中文转换'
converted = cc.convert(to_convert)
转换说明

hk2s: 繁体中文(香港标准)转简体中文
s2hk: 简体中文转繁体中文(香港标准)
s2t: 简体中文转繁体中文
s2tw: 简体中文转换成繁体中文(台湾标准)
s2twp: 简体中文转繁体中文(带短语)
t2hk: 繁体中文转繁体(香港标准)
t2s: 繁体中文转简体
t2tw: 繁体中文转繁体(台湾标准)
tw2s: 繁体中文(台湾标准)转简体中文
tw2sp:繁体中文(台湾标准)转简体中文(带短语)

详细内容参考:

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值