ubuntu繁简体转换 opencc的安装与使用

最近在看word2vec的使用,看的是下面这个教程:中英文维基百科语料上的Word2Vec实验

opencc介绍

opencc是一款非常实用的繁简体字转换工具,转换速度非常快而且效果非常好。看了教程上面的各种安装方式介绍,最后才发现其实直接使用apt-get命令安装就能正常使用了。

opencc安装与使用

" 一行命令搞定安装 "
sudo apt-get install opencc
" 一行命令使用 "
opencc -i wiki.zh.text -o wiki.zh.text.jian -c zht2zhs.ini

其中wiki.zh.text为输入文本文件, wiki.zh.text.jian为文本文件。zht2zhs.ini 是转换方式,默认的是zhs2zht.ini,即简体字转为繁体字。

使用演示

实验结果表明还是非常不错的,而且在我i5 2代CPU,8G内存的破机器上转换944MB的文本好像只用了两三分钟。

原文为繁体字

歐幾里得 西元前三世紀的希臘數學家 現在被認為是幾何之父 此畫為拉斐爾的作品 
雅典學院 数学 是利用符号语言研究數量

转换后

欧几里得 西元前三世纪的希腊数学家 现在被认为是几何之父 此画为拉斐尔的作品 
雅典学院 数学 是利用符号语言研究数量
  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值