- 博客(1)
- 收藏
- 关注
原创 机器学习平行语料库(翻译记忆库)(句对齐)开源工具及方法介绍
最近一直在做平行语料库句对齐的工作,新手上路根据自己查的一些资料这里概括一下大致的思路(这里假设你有自己的语料库,文章,而且是双语的,也就是已经翻译好的文章,并且已经做了分段,且双语已经做了段落对齐。如果没有的话可以下载,一些双语语料库,如联合国双语语料库http://opus.nlpl.eu/MultiUN.php,有了这些,你要做一个分句,接就要对齐了,之后一般是要形成一个翻译记忆库,.t...
2019-02-19 10:09:24 9080
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人