最近看了看IWSLT2008,IWSLT2010的相关文章,总体上的感觉就是大家的做法大同小异。通用的做法都是拿几个系统过来做个系统融合,在调调参数,完成,OK。但在前处理后处理的做法上各家单位就是“八仙过海,各显神通”了。我想想也是这样,主体方法测评的差距不大,什么唬人的模型拿到现在中用BLEU差别并不太大。但如果处理好细节问题,完全可以在最终的性能上PK掉其他的单位。这也就是所谓的“细节决定成败”吧。
目前,口语翻译存在的两个大问题。
第一个问题就是语料库规模不大。比起新闻语料,口语语料规模还是太小了。这就导致一个问题,在词对齐效果上不是很好。这样一来再牛的模型也表现不佳。有的单位针对词对齐效果不佳方面做改进,
第二个问题是口语中的一些特殊表达。
有的单位也去做些领域自适应的工作,或者添加语言模型。这一块在08,10年的工作中没有涉及。就不罗列了。
啰嗦这么多,就是为了mark一下,以备来日查询。