翻译软件不准确的原因

可能接触过英语的人大部分都会用啥金山词霸,有道词典,格灵词典,google翻译,百度翻译等.翻译词和短语一般是没啥问题的.但翻译一句话,或者一整篇文章,很多地方都翻译的不够准确.在软件行业快速发展的今天,虽然语言翻译软件有了一些进步,但也是进步缓慢.准确率仍然不是太高.于是你就要问翻译为啥这么不准确,这么难呢?

主要有这样三个大的原因

1.一词多义,容易产生歧义

2.文化原因,相同的话在不同的文化中表达的意思不太一样

3.人们很多时候不严格按照语法去使用语言

一词的多义现象

刚开始的时候翻译软件采取的方式一般是严格按语法来,先是整个词库.然后把一句话拿来之后是先是把里面的词一个个对应的替换掉,然后再按语法规则,把词的顺序摆好.就像我们现在编译器做的事一样,编译器实际上也是个简单的翻译软件,把源代码翻译成机器能识别的机器语言.不过由于程序语言是简洁无任何歧义,如果哪个地方有歧义它就当成错误处理的.而自然语言往往有歧义,比如一个词会对应非常多的意思,而不仅仅是一个意思.英语里一个词的意思就特别多,往往有一二十个意思.汉语的话还稍微好点,一个词的意思不会太多,实际上古代汉语一个词对应的意思也蛮多,你学过文言文的话就能深刻的体会到.

短语消除歧义

一个多义词的具体意思要看语境,所以一般还会整出很多常用的短语来.几个词在一起就叫短语.此时具有了语境,就可以消除大部分歧义了.随着存储设备的发展可以在翻译软件中多存储些短语了,而不仅是词的意思.本来如果这样一来的话准确率应该蛮高了.但实际上用上这些方式翻译出来的东东还是准确率极低.特别是在日常用语而不是学术性的文章中.这是为啥呢?

文化原因

很多话不在一定的文化背景下是理解不了的.而文化因素是个比较虚的东西,是各种习俗文化的传承,你不能说想办法把某个文化搬到电脑里去.比如中国有句骂人的话,我问候你全家女性.翻译成英语后,那些向来讲究绅士风度,女士优先的老外们一看觉得中国人真有礼貌啊,这么尊重女同志啊.连人都不能很好的理解,你指望翻译软件给你翻译好吗?

另外像中国的诗歌,方言文就更不好翻译成英语,翻译过去简直是面目全非了.像唐诗宋词你翻译成英语后还有啥意思呢,根本就变成了几句废话了,失去了原有的韵味了.

人偷懒的原因

另外翻译不准还有一个原因,是翻译软件永远不可能百分之百的准确的原因.人使用语言时总是没有完全按语法去做,总是不断的犯语法错误,而平时我们把一些病句也不当成错句.我们知道编程语言是先制定一些语法规则,然后编译器也不是全部按语法来,而给出自己的一些规则.但不管怎么说这都有确定的规则可参照.然后程序员就开始写源代码.边写边用编译器检查下看有语法错误不.所以最终写出来的代码一般没啥问题的.编程语言是先有语法才后有源代码.

先有语言后有语法

而我们的自然语言可不是先有语法才有语言的.我们中国几千年来都没有啥严格的语法.连标点符合都没,最多有几个点点.我们现在上语言课学的语法和标点符号是民国时期很多语言大师们参照英语中的语法体系整出来的.

所以你能指望我们使用语言时完全遵照语法来吗?虽然我们的教育体制是一开始就想诱使我们完全按语法来.我们读书时最印象深刻的是啥判断病句的题目了.但大家一从学校出来后就把那些语法规则抛一边去了.很少有人说话或写文章时还老考虑自己写病句不,当然一些专业的编辑,语言学者,作者,法律条例制定者不在此例啊.于是我们往往在不自觉的传播病句.

另外人往往容易偷懒,一些句子能省略就省略,往往用些关键字就差不多了.而且由于日常生活中那些众多的病句也没给我们带来啥太多的不便.因为人是很聪明的,根据几个关键字就能知道你说啥了.

而且按常理来说,语言只是一门方便我们交流的工具,只要能达到我们的目的,也不一定要完全按语法去做.

翻译软件的改进

由于老严格按语法来翻译准确率老提不高,于是很多聪明人自然会想办法.于是出现了一种基于经验的方法.通过分析大量已存在的语言资料.各种书籍,文章.从中找出一些语句和短语的搭配规律.主要统计一下某个词出现在另外一个词的前面或后面的概率.前面有讲到单个词有歧义通过常用短语用消除歧义.而这里把常用短语的概念扩展了.有更多的常用短语(按照概率来确定是不是常用),而且各个短语之前的组合也考虑在内.

所以现阶段的翻译软件的进步主要体现在收集并分析海量语言数据.以后可能还会把一些常用的语句的对应意思直接保存下来,当作一个词一样.就不用做啥转换分析.比如广东话里面骂人的话,我顶你个肺,就直接当作一个词一样保存.比如就代表fuck you的意思.

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值