opencc在linux环境中,linux – 安装OpenCC(简体繁体转换)

依赖:yum install doxygen

最近使用中文维基百科数据训练Word2Vec时,发现数据里面包含了很多繁体字,这就很尴尬了。这时候就知道OpenCC的强大了。哈哈,本来打算直接使用python里面的opencc模块的,但是在安装,编译opencc时遇到了各种错误。花费了很长时间,终于安装成功,但是文本处理起来效率很低。最终选择了直接在linux下安装OpenCC,处理的效率着实安慰了我受伤的心 — 很快,特别快。

好啦,接下来总结下OpenCC的安装方法,万一以后又用到它了呢?主要参考这篇博客:

检查下linux环境下是否已经安装cmake以及git,如果没有,那就通过yum安装好。

$ yum install cmake

$ yum install git

克隆下OpennCC开源项目OpennCC开源项目。

$ git clone https://github.com/BYVoid/OpenCC

编译OpenCC

$ cd OpenCC

$ make

$ make install

创建libopencc.so.2链接

如果不知道libopencc.so.2的路径,可以通过find / -name libopencc.so.2查找。

$ ln -s /usr/lib/libopencc.so.2 /usr/lib64/libopencc.so.2

通过查看 OpenCC 版本,检查OpenCC是否已经安装成功

$ opencc –version

测试用例

繁体转简体

$ echo ‘歐幾里得 西元前三世紀的希臘數學家’ | opencc -c t2s

欧几里得 西元前三世纪的希腊数学家

简体转繁体

$ echo ‘欧几里得 西元前三世纪的希腊数学家’ | opencc -c s2t

歐幾里得 西元前三世紀的希臘數學家

可以通过以下方式直接对文件进行繁简转换

$ opencc -i zhwiki_raw.txt -o zhwiki_t2s.txt -c t2s.json

作者:xiao蜗牛

链接:https://segmentfault.com/a/1190000010122544

来源:SegmentFault 思否

著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

喜欢 (2)or分享 (0)

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值