关于如何构建一个面向垂直领域的机器翻译引擎思路分享

机器翻译技术应用日愈火热,越来越多的场景开始考虑应用机器翻译技术来解决语言转换的效率问题,很多行业的企业用户都存在这样的的应用需求,这个应用场景存在一个痛点,人工翻译代价(资金和时间)过高,但通用领域机器翻译(比如大家所熟悉的在线翻译服务Google翻译)在某一个具体领域内翻译品质还差太远,难以满足实用的需求。

面对这样的需求,用户、机器翻译厂商和机器翻译技术研究者就提出了打造垂直领域的机器翻译引擎这个概念,比如专利翻译引擎、医学资料翻译引擎、电影字幕翻译引擎等等,希望先利用机器翻译初译,专业人员译后编辑一下,目的大大降低人工代价和提高效率。

据目前支持语言最多的机器翻译服务商——小牛翻译创始人朱靖波教授介绍,从应用角度来看,机器翻译系统构建至少涉及两个维度,即NxN个语言方向和M个垂直领域。从理论上来说,假设需要200个语种和100个垂直领域需求,我们需要构建398万个机器翻译引擎,当然实际应用需求中不需要这么多, 90%以上的应用需求可能只需要30个语种10个垂直领域,约9000个不同的机器翻译系统构建,哪怕非主要语种是通过中间语转译的,数量也还是非常多。

从目前市场上的用户需求来看,最近两年明显有一个发展趋势,垂直领域机器翻译引擎构建的应用需求不断上升,说明各个细分行业的机器翻译应用需求在不断被激活,将成为机器翻译产业应用中一个增长点,未来对口的从业者也会大大增加。

由于通用领域机器翻译品质满足不了用户需求,需要提供个性化定制服务,帮助用户构建自己的垂直领域机器翻译系统。再简单讨论一下如何从数据加工角度来构建垂直领域机器翻译系统,希望有更多对机器翻译技术感兴趣的人也投身到这个产业中。

神经机器翻译系统构建属于数据驱动的机器

  • 2
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值