By 龙前尘
分享请注明来源:
http://blog.csdn.net/svenhuayuncheng/article/details/78647591
Open Chinese Convert(OpenCC)是一个开源的中文简繁转换项目,致力于制作高质量的基于统计预料的简繁转换词库。还提供函数库(libopencc)、命令行简繁转换工具、人工校对工具、词典生成程序、在线转换服务及图形用户界面。
笔者在安装opencc插件时,遇到了HTTP 403错误,导致插件安装一直失败。由于这个插件是台湾同胞发布的,所以遇到被墙的问题在所难免。笔者在使用科学上网法后,使用命令:pip install opencc-python
,发现依然出现这个HTTP 403错误,导致无法正常下载源码和编译。
为了解决这个问题,笔者搜索了无数帖子,发现都没有办法,故只能自己动手。通过查看报错信息,以及opencc原作者成功编译的代码片段:於 Windows 下安裝 OpenCC,来解决问题。
废话少说,解决步骤如下:
把distribute_setup.py
(网盘地址: https://pan.baidu.com/s/1qYsS2wk 密码: j39g),放到C:\你安装Python的目录\Lib(例如:C:\Python27\Lib);将distribute-0.6.27.tar.gz解压缩后,在distribute-0.6.27文件夹下用命令行运行:python setup.py install,会生成一个c:\python27\lib\site-packages\distribute-0.6.27-py2.7.egg压缩包文件;
在C:\Python27\Lib\site-packages文件目录下,用命令行运行:easy_install distribute-0.6.27-py2.7.egg;
再执行pip install opencc-python安装python接口,可以发现提示安装成功,如下图示:
安装成功后,在python中进行实验:
>>> import opencc
>>> data = u'Open Chinese Convert(OpenCC)是一個開源的中文簡繁轉換項目,致力於
製作高質量的基於統計預料的簡繁轉換詞庫。還提供函數庫(libopencc)、命令行簡繁轉換
工具、人工校對工具、詞典生成程序、在線轉換服務及圖形用戶界面'
>>> cc = opencc.OpenCC('mix2s')
>>> data_new = cc.convert(data)+u'\n'
>>> print data_new
最后可以看到运行结果,繁体中文已经被转换为简体中文,如下图示:
以上。