机器翻译
一,机器翻译概论
概念:机器翻译是用计算机把一种语言翻译成另一种语言的一门科学和技术。
机器翻译的困难
-
自然语言中普遍存在的歧义和未知现象。
- 句法结构歧义、词汇歧义、语用歧义
- 新的词汇、术语、结构和语义
-
机器翻译不仅仅是字符串的转换。
-
机器翻译的解不唯一,而且始终存在的人为的标准。
基本翻译方法
1,直接转换法
2,基于规则的翻译方法
步骤如下:
- 对源语言句子进行词法分析
- 对源语言句子进行句法和语义分析
- 源语言句子结构到译文结构的转换
- 译文句法结构生成
- 源语言词汇到译文词汇的转换
- 译文词法选择与生成
它的执行过程为:独立分析 → \rightarrow →独立生成 → \rightarrow →相关转换。
因此,又称为基于转换的翻译方法。
3,基于中间语言的翻译方法
方法:输入句子 → \rightarrow →中间语言 → \rightarrow →翻译结果。
- 源语言解析器
- 比较准确的中间语言
- 目标语言生成器
4,基于语料库的翻译方法
-
基于事例的翻译方法
-
统计翻译方法
-
神经网络翻译方法
5,基本翻译方法体系
二,统计机器翻译
统计翻译的思想:
1,统计机器翻译的基本原理
噪声信道模型