Python使用Opencc库完成字符繁简体转换

背景

在日常工作中,我们常常会遇到转换中文字符繁简体的情况。接下来,我该大家介绍一个很强大的Python库,用来方便的处理字符转换。

OpenCC简介

Opencc(Open Chinese Convert)是一个开源的中文繁简体转换项目,作者是目前任职于Google的BYVoid。详细信息请看官网(https://code.google.com/p/opencc)。

OpenCC-Python安装

OpenCC支持Mac、Linux、Windows平台安装,由于我的电脑是Windows系统,下面只介绍Windows下的安装:
  1. 你需要访问这个网址(http://download.csdn.net/download/tab_space/9455349),下载一个叫做distribute-setup.zip的安装包。
  2. 解压缩这个安装包,把里面的distribute_setup.py文件放到你的Python的Lib目录中去,如果你不知道Lib目录是什么,可以用下述方法大概查看一下:
In: import sys
In: sys.path
Out:#你的Python目录

我把它放入了’C:\Anaconda\lib’中。

  1. 然后打开CMD,键入pip install opencc-python,就可以使用了

使用示例

from opencc import openCC
#繁转简
c = openCC('t2s')
#设置测试数据
data = u'Open Chinese Convert(OpenCC)是一個開源的中文簡繁轉換項目,致力於製作高質量的基於統計預料的簡繁轉換詞庫。還提供函數庫(libopencc)、命令行簡繁轉換工具、人工校對工具、詞典生成程序、在線轉換服務及圖形用戶界面'
data_new = c.convert(data)
print data_new

下面是输出结果

Out:Open Chinese Convert(OpenCC)是一个开源的中文简繁转换项目,致力于制作高质量的基于统计预料的简繁转换词库。还提供函数库(libopencc)、命令行简繁转换工具、人工校对工具、词典生成程序、在线转换服务及图形用户界面
  • 2
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值