计算机病毒的依赖性,计算机辅助框架英语依赖性翻译研究-计算机病毒论文-计算机论文.docx...

计算机辅助框架英语依赖性翻译研究-计算机病毒论文-计算机论文

——文章均为WORD文档,下载后可直接编辑使用亦可打印—— 摘要:英语翻译的核心在于对上下文依赖性的分析,本文介绍了最小依赖翻译(MinimalDependencyTranslation,MDT),旨在开发基于规则的框架,以创建基本的双语词典语法。通过机器翻译和计算机辅助翻译的融合,实现英语到其他语言的翻译,MDT中的基本单位(称为组)是带标题的多项目序列。除单词形式外,组还可以包含词素、句法语义类别和语法特征。每个组与一个或多个翻译相关联,每个翻译都是目标语言中的一个组。在翻译过程中,约束满足用于选择输入句子的一组源语言组并在相关的目标语言组中对单词进行排序。关键词:英语翻译;最小依赖翻译;机器翻译;多项目序列;语法特征1引言对于世界上大多数语言,由于缺乏足够的语法资源,因此无法采用机器学习技术完成语言的翻译。尤其对于机器翻译(MachineTranslation,MT)和计算机辅助翻译(Computer-AssistedTranslation,CAT),语法缺陷造成机器算法无法识别,因为机器学习所需的是句子对齐的翻译,相比单语语料库更为复杂。但是,对于资源匮乏的许多语言确实存在语言描述和相当多的母语使用者群体,包括亚洲语言(例如汉语、缅甸语),非洲语言(例如豪萨语)以及美洲原住民语言(例如盖丘亚语和瓜拉尼语)。因此,需要一种计算机框架,该框架有助于人们快速创建计算语法和词典,并通过可用的有限语料库对其进行自动扩展[1-2]。本文着重于将MT(尤其是CAT)转化为汉语之类的语言,通过信息系统,允许很少或没有语言经验的用户编写针对低资源语言的双语词典语法,这些语法也可以在语料库基础上更新,并且可以轻松集成进入CAT系统。利用最小依赖翻译(MDT)思想,设计了针对MT和CAT的词汇语法框架。MDT的核心是称为组的短语单元词典。群组的条目将翻译指定为一种或多种其他语言的群组。2辅助框架设计翻译系统的核心是对语言词组、短语的识别以及语句词法的交互,因此辅助框架的设计在于对以上核心内容的实验,本章节主要按照词组词典、短语词典、词典语法交易等模块进行简要设计。(1)词组词典将短语而不是单个单词视为语言的基本单位的想法至少可以追溯到贝克尔提出的“短语词典”。近年来,该模式在构造语法[3]和框架语义[4]的相关框架以及基于短语的统计机器翻译中得到了广泛的应用。支持短语单元的论点通常是根据惯用性的普遍性来构架的,即偏离严格的构成性。从另一角度看,短语单元可以解决词汇歧义的普遍性。如果动词的解释取决于其宾语或主语,则将动词与特定宾语或主语的组合视为自身的单位可能更有意义。基于惯用性和歧义性的论点是语义性的,但它们自然地扩展到翻译。如果源语言短语的含义不能严格表达该短语中单词的含义,则该短语的翻译不太可能是源语言单词的翻译的组合。向歧义词添加词法上下文可以允许MT系统选择适当的翻译。(2)简单的短语词典MDT的基本词汇条目是称为组的多词单元。每个组代表一个链组合,链超出了组成部分,包括在依赖关系树中在垂直维度上连续的元素的所有组合。例如,在该句子中“Igaveherapieceofmymind”,{I,gave}和{gave,her,piece}是链组合,但并不是句子的组成部分[5-6]。链有一个头,每个MDT组也必须有一个头,该头在词典中索引该组。该组中的其他元素是头部的从属,但该组没有详细的结构。因此,该组就构成一个最小的依赖结构。组的条目还约束了以一种或多种其他语言对小组的翻译,对于每种语言的翻译,组的条目给出一个对齐方式,表示元素之间的组间对应关系,如下所示:在基于短语的统计机器翻译的词组中,如图1所示显示了这种简单的组条目。英语词组onewayortheother,在翻译过程中将一种方式,另一方式作为汉语翻译词组该组在汉语词典中有自己的对应条目,在对齐过程中,英语组中的三个单词与汉语词组中的位置相关,而其他字符(\0)在汉语词组中不存在任何单词对应。(3)词典语法交易基本词典在两个意义上实现较为简单:给定适当的接口,不具有语言学正式知识的用户可以以直接的方式添加条目,并且易于理解所得的条目。这样的词典允许翻译作为组条目中单词形式的组合的句子,只要在整个语言中保持组顺序并且组之间不存在会影响目标语言词的形式的约束即可。但是,这样的词典不允许将其推广到词典中未明确显示的字形组合,对于每个合理可能的字形组合,都需要一个组条目。在MDT系统中,目标是从纯词汇(和短语)到句法/语法的连续性范围内的各种可能性,重点是易于创建和解释条目。(4)词汇/语法类别跨组概括的另一种直接方法是引入句法或语义类别,可以通

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值