开源项目如何本地更新
本地化在定制开源项目以适应全球用户需求的能力中起着核心作用。 除编码外,语言翻译是世界各地人们对开源项目做出贡献和参与的主要方式之一。
有一些语言服务行业专用的工具(很惊讶吗?),这些工具可以实现高质量的平滑本地化过程。 本地化工具属于以下类别:
- 计算机辅助翻译(CAT)工具
- 机器翻译(MT)引擎
- 翻译管理系统(TMS)
- 术语管理工具
- 本地化自动化工具
这些工具的专有版本可能非常昂贵。 SDL Trados Studio(领先的CAT工具)的单个许可证可能要花费数千欧元,即使那样,它仅对一个人有用,并且自定义项受到限制(并且psst,它们也要花费更多)。 希望将其本地化为多种语言并简化其本地化过程的开源项目将希望使用开源工具来节省成本并获得定制所需的灵活性。 我已经对许多开源本地化工具项目进行了汇总,以帮助您决定使用什么。
计算机辅助翻译(CAT)工具
CAT工具是语言服务行业的重要组成部分。 顾名思义,CAT工具可帮助翻译人员尽快地执行翻译,双语审阅和单语审阅的任务,并通过重复使用翻译后的内容(也称为翻译记忆库)来实现最高的一致性。 翻译记忆库和术语记忆是CAT工具的两个主要功能。 它们使翻译人员可以在新项目中重用旧项目中以前翻译的内容。 这使他们可以在更短的时间内翻译大量的单词,同时通过术语和样式一致性保持高质量。 这对于本地化特别方便,因为许多软件和Web UI中的文本在平台和应用程序之间通常是相同的。 但是CAT工具是独立的软件,需要使用它们的翻译人员在本地工作并合并到中央存储库。
签出工具:
机器翻译(MT)引擎
MT引擎可自动将文本从一种语言传输到另一种语言。 MT分为三种主要方法:基于规则的,统计的和神经方法(这是新的参与者)。 MT是最广泛使用的方法论,即统计学,它通过使用n- gram模型对带注释的双语语料库数据进行统计分析来(简而言之)得出关于一对语言的互连性的结论。 当将新的源语言短语引入引擎进行翻译时,它会在分析的语料库数据中查找以统计意义上相关的对等词,并以目标语言生成。 MT可以帮助翻译人员提高工作效率,将翻译人员的主要任务从将源文本翻译为目标文本,再对MT引擎的目标语言输出进行后期编辑。 我不建议在本地化中使用原始MT输出,但是如果您的社区接受过后期编辑技术的培训,则MT可以成为帮助他们做出大量贡献的有用工具。
签出工具:
翻译管理系统(TMS)
TMS工具是基于Web的平台,可让您管理本地化项目,并使翻译人员和审阅者尽其所能。 大多数TMS工具旨在通过包括版本控制系统(VCS)集成,云服务集成,项目报告以及标准翻译记忆库和术语调用功能来自动化本地化过程的许多手动部分。 这些工具最适合社区本地化或翻译项目,因为它们允许大量的翻译和审阅者为项目做出贡献。 有些还使用所见即所得(WYSIWYG)编辑器为翻译人员提供其翻译的上下文。 这种添加的上下文提高了翻译的准确性,并减少了翻译在用户界面中进行翻译和审阅翻译之间必须等待的时间。
签出工具
术语管理工具
术语管理工具为您提供GUI来创建术语资源(称为术语库)以添加上下文并确保翻译的一致性。 CAT工具和TMS平台会消耗这些资源,以帮助翻译人员进行翻译。 对于根据上下文术语可以是名词或动词的语言,术语管理工具可让您添加术语的元数据,以标记其性别,词性,单语定义以及上下文线索。 术语管理通常在本地化过程中服务不足,但同样重要。 在开源生态系统和专有生态系统中,只有少数选择。
签出工具
本地化自动化工具
本地化自动化工具简化了处理本地化数据的方式。 这可以包括文本提取,文件格式转换,令牌化,VCS同步,术语提取,预翻译以及对常见本地化标准文件格式的各种质量检查。 在某些工具套件中,例如Okapi Framework,您可以创建自动化管道来执行各种本地化任务。 这对于多种情况可能非常有用,但是它们的主要实用程序是通过自动执行许多任务来节省时间。 它们还可以使您更接近更连续的本地化过程。
签出工具
为什么开源是关键
公开进行时本地化是最强大和有效的。 这些工具应使您和您的社区有能力将您的项目本地化为尽可能多的语言。
想了解更多? 查看以下其他资源:
- 免费/开源机器翻译软件列表
- 打开翻译工具电子书
Jeff Beatty将在7月12日至15日在盐湖城举行的OpenWest上讨论开源本地化工具 。
翻译自: https://opensource.com/article/17/6/open-source-localization-tools
开源项目如何本地更新