简繁转换


注: 原来的linux-wiki突然当掉了,于是就粘贴过来:

http://www.linux-wiki.cn/index.php?title=%E7%AE%80%E7%B9%81%E8%BD%AC%E6%8D%A2&variant=zh-tw

漢字簡繁轉換的意義不言而喻,本文討論在Linux中實現簡繁轉換的幾種方法之優劣。


提示: 
本文所提供的方法都不完善,如果你有更好的方案,歡迎修改本文。
目錄
[隱藏]
1 OpenOffice.Org的轉換功能
2 google翻譯功能
3 使用iconv轉換
4 使用cconv轉換
5 不同方法比較
5.1 測試樣例
5.2 測試結果
OpenOffice.Org的轉換功能
OpenOffice.Org提供簡繁功能,使用很方便(在工具->語言->中文簡繁轉換)。


google翻譯功能
http://translate.google.com/ google翻譯也可以做簡繁轉換,效果分析見後面。




使用iconv轉換
iconv是用來轉換編碼的小工具。現在的iconv在執行編碼從gb2312到big5的轉化時,實現了簡繁轉換。


使用iconv進行簡繁轉換的方法為:


iconv -f gb2312 -t big5 gb_input.txt > big5_output.txt
如果原來的文件是UTF-8編碼的,則需要使用命令:


iconv -f utf8 -t gb2312 jian.txt | iconv -f gb2312 -t big5 | iconv -f big5 -t utf8 > fan.txt
注意一定要先轉化成gb2312,再由gb2312轉成big5。


繁簡轉換則類似:


iconv -f utf8 -t big5 fan.txt | iconv -f big5 -t gb2312 | iconv -f gb2312 -t utf8 > jian.txt
如果有zh-autoconvert,則可以用它代替中間的iconv,如


iconv -f utf8 -t big5 fan.txt | autogb | iconv -f gbk -t utf8 > jian.txt



iconv -f utf8 -t gbk jian.txt | autob5 | iconv -f big5 -t utf8 > fan.txt
使用cconv轉換
http://code.google.com/p/cconv/


ubuntu用戶可以用命令「sudo apt-get install cconv」安裝。


cconv是建立在iconv之上,增加了詞語轉換能力,效果分析見後面。


使用cconv進行簡繁轉換的方法為:


cconv -f UTF8-CN -t UTF8-HK jian.txt -o fan.txt



  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
模仿语言包式的简繁转换功能插件,轻松实现繁体和简体互换,很方便,只有一个JS文件。Std_StranJF.js文件只支持GB2312码,big52gb.js支持utf-8。   一、将繁简互换JS文件上传至空间:   如果您调用的是,则将繁简互换JS文件(Std_StranJF.Js)上传至网站的js目录中。当然您也可以上传至网站的其他何地方,如根目录下。如果上传在网站根目录下,则要将调用代码改成:   二、页面调用的方法:   在您的网站中请按以下方法添加以下的代码:   1. 在页面中加上以下链接:   繁体中文   这个是每个页面中显示进行简繁转换的链接,您可以放在页面顶部,如顶部的导航处。   如果您用的是默认的动易模板,则进入网站后台,依次点击“系统设置”->“自定义标签管理”->“2006海蓝”->“{$MY_动易2006海蓝首页顶}”->点击“修改”链接,在出现的自定义标签内容页面中,找到“{$ShowChannel} {$Rss}{$Wap}”,修改成“{$ShowChannel} |繁体中文|{$Rss}{$Wap}”即可。当然您也可以放在任何您想要放置的地方。   2. 在页面中放以下代码:      这个是每个页面中要调用繁体和简体互换的JS代码,您放在页面底部,如前面。   如果您用的是默认的动易模板,则进入网站后台,依次点击“系统设置”->“自定义标签管理”->“2006海蓝”->“{$MY_动易2006海蓝网页底}”->点击“修改”链接,在出现的自定义标签内容页面中,找到“”,修改成“”即可。当然您也可以放在任何您想要放置的地方。   小提示:您也可以不修改自定义标签,而是通过系统模板批量替换功能来添加以上的代码。但利用修改模板的自定义标签内容更方便。在修改了自定义标签后要记得更新您网站的缓存。若您开启了网站的生成功能,则在添加了代码后要生成全部相关的页面。   三、繁简互换JS文件参数的修改:   您可以进一步修改繁简互换JS文件(Std_StranJF.Js)以达到您想要的效果。请以记事本打开修改Std_StranJF.Js文件:   var Default_isFT = 0 //默认是否繁体,0-简体,1-繁体   var StranIt_Delay = 50 //翻译延时毫秒(设这个的目的是让网页先流畅的显现出来)   同时如果您的网站中有本文件中没有放入的繁体与简体互换的内容,则可以在本文件中进一步添加与扩充,以满足您的应用需求。   小提示:本插件同时可用于论坛等需要进行繁简互换的地方。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值