为了简化研究,找了老的版本,用VC编译成功,运行没什么问题,第一感觉是太慢,所有table都要加载到内存,大数据量绝对是死,但是为了研究基本思路和理论应该足够了。
计划,目前只针对Phase -based MT:
第一步是想从代码级了解在数据结构上,语言模型,phase table 都是怎么加载到内存里的?什么结构能保证快速搜索?
第二步是想知道Moses通过什么路径找到最佳候选翻译?语言模型,phase table,reorderring table 之间的关联关系如何建立的?
第三步是希望能最一些订制和修改,看看对速度和结果有什么影响。
循序渐进吧。。。