机器翻译的译后编辑(PEMT)

序言

机器翻译译后编辑(PEMT)并非昨天才诞生的。相反,译后编辑几乎和机器翻译(MT)同时诞生。

PEMT:无需创新

首先,PEMT与修订无关,也不需要所谓译创的“创造力”。尽管有关于该主题的所有文章和全新的ISO标准,但迄今为止,最准确的译后编辑定义来自2010 TAUS实践中的译后编辑报告:“译后编辑是用‘最少的人工’改进机器生成的翻译的过程。”
此定义中的关键是“最少的人工”。
修订是基于对源文本和目标文本的对比分析,需要修订者检查和编辑术语、风格和语法,而PEMT的特点是生产率更高且认知双语要求不高。主要更改将涉及机械性错误(大写和标点符号)、语法错误,术语不一致(例如,单词遗漏)以及其他问题,这些问题通常是源文本质量较差并导致目标文本可读性较差的结果。译后编辑者不希望重写整个句子(除非这些句子很明显是胡说八道或存在言语杂乱的问题),因此他们仅应修改必要内容以使句子更清晰易懂。
修订者与译后编辑者的技能也有所不同:修订者必须对源语言和目标语言、翻译技巧和特定领域都有全面的了解,而译后编辑者甚至可能仅懂一种语言。但是,不管怎样,他们必须对目标语言和特定领域有深入的了解,并且最好对机器翻译的工作原理有所了解。

实践中的3种PEMT方法

PEMT与企业

让我们以一家已经开发自己的引擎的企业为例。PEMT任务可以在CAT环境中进行,或者对于拥有自己的MT引擎但没有翻译部门的企业,则可以将其委托给外部语言服务提供商(LSP)。
因为我们使用了定制引擎,因此MT输出的质量会比较高。PEMT指南将非常具体,并会严格根据相关发动机产生的错相反,译后编辑几乎和机器翻译(MT)同时诞生。尽管目前有大量关于此主题的材料可供使用,但是讨论的细微差别使得在某些情况下我们冒着忽视PEMT真正含义的风险。关重要。

PEMT和LSP

只有少数LSP具有开发为客户定制MT引擎所需的财力和技术资源。大多数LSP选择使用由MT技术提供商开发的垂直领域(特定领域的)的引擎,并根据SaaS模式(租赁模式)按次付费。MT输出将发送到内部或外部的译后编辑器。或者,译后编辑者会收到API密钥,以在CAT工具环境中使用垂直级MT引擎。在这种特定情况下,译后编辑成为一项交互式任务。
一些LSP会使用通用MT引擎(例如Google Translate或DeepL)预先翻译源文本。如果您刚开始使用MT、翻译短篇文本或再次面临财力/技术资源短缺时,这是一个可行的经济型选择。
在这种方法中,由于译后编辑的级别和目标会因项目而异,或者因客户而异,因此LSP总是需要提供有关翻译最终用途的信息以及有关如何执行任务的准确指南。PEMT项目可以在许多译后编辑中进行划分:指南的具体程度和严谨程度将在一定程度上确保翻译产出的一致性。提供客户专用的术语词汇表、保证术语一致性也很重要,尤其是在使用通用引擎的情况下。

PEMT和自由译者

自由译者反对机器翻译的日子一去不复返了。如今,大多数自由译者都把机器翻译作为提供翻译建议的有用工具。他们通常选择谷歌翻译或DeepL (网页版本或使用API密钥)。
在这种情况下,自由译者通常没有精确的PEMT指南。自由译者可选择使用一个或多个通用MT引擎,自由决定使用哪种MT工具,如何使用它,以及采用多少MT输出。但从职业道德的角度来看,自由译者应该告知客户其使用了通用MT引擎,或者询问客户是否有不能使用通用MT引擎的特别要求。要注意医疗记录、法律文件(涉及敏感信息或个人资料,总而言之就是要遵循通用数据保护条例)以及机密文件或知识产权保护文件。
要记住一件事:当在CAT工具环境中通过API密钥使用通用MT引擎时,在某些情况下,包含MT输出的片段可能被标记为AT(自动翻译)或MT(机器翻译),从而显示它们的来源。

翻译流程中的PEMT

同样值得注意的是,自动翻译并不是由一台拥有自由意志和独立(尽管是电子的)大脑的机器创造出来的。MT输出(自动翻译的技术术语)是由随机计算生成的,就像统计和神经机器翻译一样,由算法生成;该算法利用双语翻译语料库,更广泛地说,利用人类的语言数据。可能有不同原因影响机器翻译输出质量的高低的:缺乏清晰的语言数据,MT引擎发展所需的技术资源和财力短缺,源文本的质量不高等等……但所有这些原因的共同点是都包含人的因素。
PEMT应该取代TEP(翻译、编辑、校对)模式的两个主要阶段。为了实现MT引擎应用,有必要使翻译工作流程根据该项技术作出改进,并确保您的TMS(翻译管理系统)具备有效管理PEMT阶段所需的条件。
如果您开发了自己的MT引擎,则TMS提供程序应使您能够通过API密钥进行连接。
译后编辑人员应掌握语言资源:拼写检查字典、术语库,并应具有上传PEMT指南作为参考资料的能力。

翻译自动化用户协会(TAUS)的七条译后编辑原则

  1. 追求语义正确的翻译;
  2. 保证信息未被意外地增删;
  3. 编辑任何具有攻击性、不合理或文化上不可接受的内容;
  4. 尽可能多地使用原始机译产出;
  5. 遵循基本的拼写原则;
  6. 没有必要在风格方面进行更改;
  7. 没有必要仅仅为了提高文本的流畅性重组句子;
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值