21世纪-面向计算机技术的自然语言变革

21世纪-面向计算机技术的自然语言变革

刘 莎
01-6-11 下午 02:32:16

--------------------------------------------------------------------------------


一、网络世界的语言困境
所有在计算机网络世界周游过的人,都会为其“地大物博”而欣喜和感慨。一个近似于发现美洲新大陆的淘金热和工业革命时代的圈地运动,已经在网络世界迅速展开。在这片没有疆界也不需要护照的数字“沃土”上,有人一夜暴富,有人败走卖城。而中国的网络服务商,大概都尝到了差不多同样的滋味:走上了一条拓荒者之路。
中国有近千万计算机用户,为什么千呼万唤,目前因特网的用户却只有30万。对现有用户的调查结果表明,一是上网费用太高。二是网上内容太少。但仔细分析一下,归根结底还是语言障碍。费用高,是由于种种历史原因造成的,有钱人多数英语不好,上网也看不懂多少东西。内容少,则是因为能看懂的文字太少。这恐怕是所有英语世界之外的国度,甚至整个网络世界,都无法回避的一个根本问题:网络世界也有疆界,这疆界就是语言屏障。
语言屏障使“YAHOO”只能使英语世界的“雅虎”。对于任何动态服务系统而言,像“WINDOWS”一样在世界各地都实现本地化,其成本实在不可设想。
语言屏障至少使世界上50%以上的计算机用户,即使既有需求又有经济实力,仍然无法在网络世界倘佯。日本上网人口的比例只有美国的九分之一,二马来西亚上网人口的比例却能和美国持平,就是有力的证明。
语言屏障使非英语世界的网络服务商即使“磨刀霍霍”,却抓不到多少“猪羊”。
面对语言屏障,所有英语世界之外的网络服务商都在努力开拓各种民族语言的网络王国:德语“网”、法语“网”、“汉语”网……但谁都明白,因特网的真正优势是信息资源全球共享,这只有在真正解决语言障碍之后才可能实现。否则,我们不过是在描绘一张新的世界地图。最终,在这张新的网络世界地图上,其网络国家的数目比行政国家的数目少不了多少,而且是一个更难以管理的网络联合国。
如果在计算机上有一个自然语言领域“JAVA”,能打通所有的语言屏障,该有多好!
这真是一个做了半个世纪的梦。无数人为此前仆后继,苦心探索。有人说前途渺茫,有人在黑暗中继续拼搏。而事实上,自然语言世界的“JAVA”正在敲响我们的大门。

二、技术进步与语言变革
有语言历史学家报告,在1万年前,当世界人口只有100万时,人类使用着1.5万种语言。今天,世界人口增长了5000倍,语言种类却减少了一半。而在未来的100年内,还会有三分之一(近2000种语言),将不以人们的意志为转移地从地球上消失。据称,在这个“大语种迫害小语种”的悲惨历史进程中,因特网将是下一个最有力的语言杀手。
暂且不论语言种类的多少与人类文明发展的关系究竟如何,这一报告至少明确地道出了一个往日不大为我们所重视的基本事实——技术进步越来越深刻地影响着自然语言的发展与变革。
观察一下今日的语言分布世界地图,我们马上会感受到,在自然语言弱肉强食的历史中,强权政治的确曾经是一种十分强大的力量。从表面看来,进入信息时代以后,用来交换信息的语言就像用来交换财富的货币一样,以其自由兑换能力进行着扩张。因此,英语自然而然地跟随着美元,在全世界成为一种“硬通货”。但是实际上,技术进步从来都是一种虽不显山露水,却十分强大的力量。
比如,在古老而又年轻的中国,从文言文到白话文,从繁体字到简体字,从方言割据到普通话的成功推广,在语言文字的改革和标准化进程中,技术的力量都功不可没。凡是没有简化的汉字,通过印刷技术被强行淘汰;凡是听得到无线电广播的地方,首先听到和听得最多的都是标准普通话。难以想象在幅员辽阔而又人口众多的中国,没有印刷术和无线电技术的支持,简化汉字和推广普通话的运动会是一个什么样的结果。而今天,无论身处世界的哪一个角落,无论操着何种方言,素昧平生的华人拿起电话后说的第一句中国话,一定是普通话(无论多么的南腔北调)。与此同时,方言的发展也在受着普通话潜移默化的影响。为了达到普遍交流的目的,一部分方言词汇逐渐自发地被意义相近的普通话词汇取代。因此,汉语普通话标准的成功推广,不仅满足了华人在世界各地普遍交流的需要,而且促进了汉语文化的协同发展。
自从计算机技术进入文字信息处理领域以来,采用非拼音文字的人们,便首先感受到了它对语言发展的影响和制约:无论是在字典里已经收入的汉字,还是在日常生活中已经普遍流行的方言、口语,只要计算机字库里没有收入,在计算机所提供的文字信息世界就不可能存在。随着因特网的日益普及,计算机正越来越普遍地应用于个人交流领域,这将使计算机技术比印刷技术更深入地支持和推动语言的标准化。
事情还不仅仅如此。印刷术、复印机、电话、电视、无线电等信息传播技术都是信息复制技术。而计算机则不止是一种信息复制工具。它在信息加工和人机对话方面所拥有的特殊能力,正在不断地引诱着人类去适应计算机对人类的要求。
比如,无论应用什么样的机器翻译系统,人们很快就会发现,自然语言表达越规范,机器翻译系统的翻译质量就越高。因此,在机器翻译界进行了各种各样的自动翻译方法探索之后,采用“自然语言受限方案”(根据机器翻译的实际能力对自然语言的表达方式进行系统规范),正在日益成为新的技术主流。而“自然语言受限方案”的实质,正是面向计算机技术对人类的自然语言本身进行改造和约束。
机器世界是一个标准化的世界。要想充分利用计算机的人机对话能力为人类服务,我们必须创造出机器所能接受和“理解”的语言方式。计算机程序语言之所以能在人与机器之间架起通讯的桥梁,正是因为人类面向机器进行了某种意义的语言标准化。
语言是文化的载体,但更是信息交流的工具。因此,尽管听起来有点耸人听闻,但计算机技术在自然语言处理和信息远程传递领域的巨大能量,正在诱使人类面向计算机进行自然语言变革。在未来的21世纪,每个公民都可能深刻地感受到,计算机影响并且改变了它的语言生活。
三、英语是否能够成为世界标准语
当被人们寄以厚望的机器翻译技术发展长期受挫之后,有人无奈地说,克服不同自然语言交流障碍的希望,看来只能寄托在某种自然语言的全球普及上。随着计算机网络的无孔不入,英语的普及趋势似乎也越来越强劲。英语果真能够成为未来的世界语吗?或者说,非英语国家和地区将必然走向双语制,就像中国的普通话和地方方言的关系一样?
在这个问题上,简单地肯定或否定都没有意义。自然语言在政治、经济、文化、技术发展的合力之下,有它自身的发展演变规律。
首先,人际交流永远是以地域化为主流的。中国的孩子们虽然一抱上课本就开始学习普通话,一上中学就开始学习英语,但母语方言始终是生生不息、代代相传的第一交际语。因此,即使是最悲观的估计,至少在21世纪,还会有几十种语言和他们的文化一起,顽强地生存在地球上。
其次,语言是一种如果不用就会遗忘的信息交流工具。即使在双语国家和地区,还是有许多人由于没有足够的使用频率,而渐渐遗失或不能熟练应用他们曾经习得的第二语言技能。
第三,即使未来的大多数职业都可能或多或少地使用计算机网络,仅仅处于自我文化保护的本能,民族语言的普及教育及其在网络领域的发展,必然会始终受到各民族社会力量的强有力支持。
因此,在可能预测的未来,即使是最乐观的预测,英语成为世界通用语的可能性和意义都始终是相对的。要想让因特网在全球范围内像电话一样普及,必须成功地消除语言屏障。

四、自动机器翻译的能力边界
相对于信息时代多语交流的普遍需求,人类的自然语言学习能力实在是微不足道。因此,机器翻译从新成为新的信息技术热点。但是,只要用过或者看国现有机器翻译软件的人都知道,虽然经过了40多年的艰苦探索,用最重要的技术标准——可靠性来衡量,现有的机器翻译系统无一能真正过关。那么,究竟是什么问题阻碍了机器翻译技术走向成熟呢?
举一个人们熟悉的例子:IBM公司的超级电脑“深蓝”,可以击败国际象棋棋王卡斯帕罗夫。因为它每秒钟可以上亿次的运算,并且记忆下了世界上的所有棋谱(当然,也包括卡斯帕罗夫的全部棋谱)。但是,如果给它输入一个对人而言并不难执行的指令:“赢棋,并且让对手还想再下一盘。”“深蓝”则将一筹莫展。为什么呢?因为促使人们还想再下一盘的条件,因人、因地、因时而具有很大的随机性,不可能形成系统的变化参数。因此,不可能形成有意义的变化模型,供计算机进行高速运算和穷举搜索。
从信息论的角度来解释,所谓随机性,就是不能用任何信息量更少的算法来进行计算。因此,对于天气预报一类的开放性随机课题,无论计算机系统的功能多么强大,其解决问题的实际能力总是有限的。而自然语言翻译恰好就是这类课题。
自然语言是一个不断生长变化的开放性随机系统。
首先,新词或者旧词的新用法(包括语法、句法)在不断被创造出来。并且只要流通便被承认。当越来越多的人采用某种共同的用法时,这个词或语法也就被收入词典和语法书。因此,作为一个自发标准系统的开放型数据库,无论是纸介词典,还是电子词典,所收录的内容永远滞后。
其次,在自发的标准化过程中,自然语言产生出大量的一词多义和语法表达歧义。
因此,人类在解读自然语言信息时,除了要不断地学习新词及旧词的新用法之外,还需要根据上下文语境和交流对话场景,随时进行语义分析。而上下文语境和交流对话场景也同样具有开放性和随机性特征。所以,当我们突然闯入一个陌生的对话场景时,由于缺少必要的语义分析背景信息,往往是听得懂交谈者说的每一个单词,却不明白具体的语义内容。
借用现代混沌理论的术语来描述自然语言,我们可以说,每一种自然语言都是一个对语言环境具有敏感依赖性,在语义表达形式方面具有无穷自创生能力,语言“理解”行为具有某种不可预见性的“混沌”系统。因此,从逻辑上讲,质量可靠的全自动翻译系统根本就不可能产生。
当然,任何混沌系统都不是一个完全无序的系统。自然语言也有大量的规则、规律和概率性知识可供计算机处理。站在应用的角度看,即使是质量不可靠的全自动翻译技术,也仍然有一定的使用价值。但是,如果要想从根本上解决机器翻译的质量问题,我们必须在自然语言受限领域拥有具有普遍意义的新技术。这种新技术必须既能及时地反映自然语言的发展变化,又能合理地限制自然语言表达的随机性,以保证我们能够在有限的变化参数的基础上,制造出够用的变化模型,供计算机进行机器翻译高速运算和穷举搜索。
无论对于机器翻译技术的发展,还是对于普遍消除语言交流屏障,也许都只剩下“华山”一条路。闯过这一关,才能海阔天空。

五、计算机上的世界标准语
以荷兰医生柴门霍夫发明的世界语为代表,至今已经又上千种人工世界语的方案了。几乎所有方案都有一个共同的特征,就是建立一种简便易学、没有一词多义和语法歧义的规范语言,然后让这种语言成为不同民族进行交流时的世界标准语。虽然迄今为止,这些人工世界语都远未能达到自己的预期目的,但所有的发明者都在不断强调着同一个道理:无论人类的语言如何千差万别,它们之所以能够相互翻译,是因为它们都是对同一个客观世界的描述,因此,有可能建立一种简洁、规范、统一的自然语言。
对于人工世界语的艰难处境,人们通常分析出种种文化和社会因素。但现在看来,恐怕最缺乏的还是必要的技术支持。有了现代计算机技术的强有力支持,人工世界语完全可以是另外一种崭新的模样:
l、利用计算机技术对自然语言词汇的语义进行合理限制,人工世界语可以直接采用多种自然语言的文字符号,以免除学习和背诵单词的麻烦与苦恼。
2、利用计算机所提供的可视化窗口,人工世界语的句法可以摆脱自然语言线性表达方式的束缚,建立直观易学的空间定位句法。
3、利用计算机的自动翻译系统,人工世界语既可以供不同自然语言用户在计算机界面上直接阅读,又可以转换为多种自然语言符号形式。
总之,充分调动计算机所提供的技术手段,人工世界语完全可以像自行车一样方便易学。也许,这种基于计算机技术的人工世界语,本身就是一种通用的自然语言受限平台。或者说,它更像是一种面向计算机技术的语言信息交流标准化工具。不管它究竟是什么,我们还是先给它起个名字,叫做语言信息交流模版。
六、语言信息交流模版——消除语言信息交流屏障的新技术
有一件事在工业界是明确的:有许多优秀的人才正在做着或多或少相同的但具有相互竞争的事情。可是,什么才能创造革命性的技术?它不仅要更快、更好、更便宜,还要影响我们做事的根基,它必须以一种简单的方法去解决根本性的问题。
(最初的JAVA开发小组成员之一Patrick Naughton)
……标准化以科学、技术与实践的综合成果为依据,它不仅奠定当前的基础,而且还决定了将来的发展,它始终与科学技术发展的步伐相一致。
(国际标准化组织标准化原理研究常设委员会)

无论是为机器翻译技术建立多语通用的自然语言受限平台,还是面向计算机技术设计多语通用的信息交流模版,事实上都是对不同自然语言进行统一的自觉标准化。因此,可以将标准化方法作为设计自然语言交流模版的基本方法。
1、设计自然语言交流模版的标准化方法
标准化普遍原理既基本方法之一:“统一”,既把分散的具有多样性、相关性和重复性特征的事物予以科学合理的归并,从而达到在紊乱中建立秩序,使性能和作用接近一致的元件,彼此可以相互替代。
在所有自然语言的词汇层面上,都具有典型的多样性、相关性和重复性特征。为了在多语交流模版上成功地进行不同自然语言的词汇互换,我们可以首先以英语为基础,建立一个词汇层面的统一归并框架:
(1)通过基础性概念的强制性补齐,保证不同自然语言基础词之间能够彼此互换。
(2)在各种自然语言中,基础词都有大量的近义词。当出现近义词对应空缺时,则有由基础词进行替代。比如,当汉语中的“笑逐言开”在英语中找不到概念对应词时,则有英语中的基础词“laugh”进行近义替代(见表1)
表1
词汇层面概念统一编码框架 英语 汉语 俄语 日语
基础词 laugh 笑 基础词 基础词
近义附码 A程度+ BurstIn to laughterguffaw 大笑
 狂笑
B程度- Smilegrin 微笑
C成语 笑逐言开
D书面语
E口语 笑哈哈
笑嘻嘻
F俚语
G俗语
H褒义
I贬义 snicker 傻笑
J其它近义

注:1、每种语言的基础词语义由同一语言的近义附码叠加定义。 2、如果出现某种自然语言基础词空缺,则用该种自然语言已白吗词汇进行语义描述。

在语法方面,虽然各种自然语言的语法表达有很大的差别,但事实上绝大多数自然语言都存在十分近似的深层语法概念(主语、谓语、宾语、修饰语、补足语等)我们将具有共性的深层句法概念直接提升为显性语法,设计出一种在计算机界面上直接使用的统一句法框架。(表2为统一句法框架示意图)
表2
修饰区 核心区 补充区

主语区 多重修饰 程度、数量修饰 单一修饰 并列主语 单一主词、同位主语 修(插) 修 修
~ ~ ~ 单一、并列谓词 主 谓(入) 宾
~ ~ ~ 主语子句宾词 补 补 补(区)
谓语区 主词 谓词 宾词 (过去时) 能原谓词 (将来时) 单一补充
~ ~ ~ (否定) 核心谓词 (被动态) 间接宾语
~ ~ ~ (进行体) 并列谓词 (完成时) 简单并列补充
宾语区 多重修饰 程度、数量修饰 单一修饰 并列宾语 单一宾词、同位宾语 单一补充
~ ~ ~ 单一、并列谓词 简单并列补充
~ ~ ~ 宾语子句宾词
整句连词 标点


注:当人脑进行自然语言理解时,往往是将语义分析和语法分析混合使用。但如果语义分析出现困难,语法分析就变得十分重要。由于机器翻译技术在语义分析方面能力有限,从源语中得到完整并且正确的语法信息,成为保证机器翻译质量的必要条件。
标准化普遍原理及基本方法之二:取消多余的、可替换的和低功能的环节,保证其构成的精练、合理。
迄今为止,各种自然语言词汇都在不断膨胀。如果任何新发明的词汇都自动拥有在机器翻译系统中使用的合法权利,那么,机器翻译的质量不可能得到根本保障。即使是人工翻译,许多概念也无法在得到忠实再现。因此,以“可替换”和“低功能”作为衡量标准,无论自然语言的词汇概念系统,还是语法概念系统,都可以进行简化。
简化的方法是按下述统一编码框架为标准,建立强制性准入机制:凡未获得统一编码的词汇、短语、词汇义项,包括语法成分,均不允许进入交流模版使用。(参见表3)
表3
多义词义项受限编码 义项 近义词群语义叠加定义
(汉语)“好”在多数汉语词典中都有10多个义项。但交流模版中运行使用的义项只有8个。 义项1 与“坏”相对 优、精、良、妙、出色、到家----
义项2 友爱 友善、友好、和睦、投机------
义项3 健康 结实、强壮、健全、硬朗------
义项4 同意 认可、首肯、可以-------
义项5 容易 轻易、轻而易举、便当、简易------
义项6 便于 方便、省事、轻便、便捷-------
义项7 非常 特别、格外、分外、万分、甚------
义项8 喜欢 喜爱、喜好、喜、爱------
注:凡不能用基础概念进行编码的多义词义项,均作为冗余概念补允许使用。

标准化普遍原理及基本方法之三:组合,既选择标准通用元件,增加专用元件,组成新产品。
通过“概念补齐”和“准入简化”,我们已经选择出了词汇和语法层面的标准通用元件。只需给出追加新增词汇、专业术语的方法,就可以组合出一种“新产品”——语言信息交流标准模版。
在语言信息交流模版的设计过程中,最重要的工作是确定组合元件。确定组合元件的标准化程序是:
(1)确定其应用范围:利用计算机技术进行多语交流和符号互换。
(2)编排组合型谱:由选定的词汇和语法元件组成语言信息交流标准系统。
(3)检验组合元件能否完成各种预定的组合:如用多种自然语言权威语法教材的所有例句,检测标准语法元件的组合能力。
(4)为组合元件设计人机交互界面:为方便用户的识别和检索,可以为基础概念设计可视化语义代码,建立名词实物图谱,提供标准概念的非键盘检索路径。
标准化普遍原理及基本方法之四:“效益最优化”和“先进性原则”,即所做的统一规定应有利于生产发展和技术进步,有利于更好地满足社会需求,促进产品质量的提高。
对于“效益最优化”和“先进性原则”,人们最担心的恐怕是,强制性的标准化方法会在多大程度上损失自然语言的丰富表达力,既不同的自然语言之间存在着千差万别的非镜像关系,我们能够设计出一个既多语通用,又有丰富表达能力的交流模版吗?
首先,从理论上讲,构成自然语言丰富表达能力的基本要素是词汇的够用性和语法的组合能力。由于标准系统允许每一种自然语言进行词汇层面的概念补齐,只要语法结构健全,就可以组合出够用且丰富的表达能力。
其次,不同自然语言之间的非镜像关系,只要是在合理的范围之内,并不影响彼此的互换和相关概念的配合。
第三,标准化以牺牲某些个性为前提,以换取最大限度的互换和组合能力。实践证明,这一做法是推动技术进步和人类文明发展的一种必要和明智的选择。
最后,通过语言信息模版的开发试验,以及以该模版为语言表达受限平台的英汉互译初步试验,我们已经清楚地看到,多语交流模版不仅可以供不同自然语言用户直接进行语言信息交流,而且为机器翻译技术走向实用提供了帮助。传统机器翻译方法的一个误区就是过于看重全自动翻译速度和翻译结果的自然。而事实上,保证语义信息传递的准确性,只要懂得母语即可完成翻译操作,并且能够多语互译,应该是更有价值的机器翻译目标。因为只有实现了这3条技术指标的机器翻译系统,才能普遍减轻人类学习外语的负担,因而也具有更广泛的应用价值。
2、语言信息交流模版的使用方法
(1)计算机用户通过自己熟悉的自然语言在计算机上输入语言信息。
(2)交流模版自动确认已获得统一编码的词汇、词组、短语和语法成分,并将确认结果显示在交流模版上。
(3)未获得自动确认的多义词,由交流模版提供已编码义项供用户选择。
(4)未获得自动确认的语法成分,用户根据统一编码句法放位规则,人工调整或调入标准句法框架。
(5)用户选择需翻译的语种,计算机自动转换生成为指定自然语言表达形式。
如在“I see a boy with a telescope near the bank”这个自然语言表达式中,既有词汇歧义,又有句法歧义。在交流模版上,用户可以通过对“with a telescope”的放位进行句法歧义消解。而对“bank”的词汇歧义,则通过受限义项选择进行消解。
3、交流模版的实用价值
(1)交流模版在不依赖自动分析和自动生成技术的前提下,也可以为用户提供多语信息交流服务:在信息输入方,用户只需学会句法放位规则,依靠母语既可使用交流模版进行语义表达。在信息接受方,通过在组句框架上直接进行文字符号的语种自动转换,和句法放位信息,即使没有经过任何学习,也可以直接解读模版上的语义信息。
虽然在不依赖自动分析和自动生成技术的前提下使用交流模版显得有点原始,并且翻译速度也不高。但在真正遇到人机交流障碍时,使用交流模版要比使用任何全自动机器翻译系统更可靠、更方便。
所谓可靠,就是采用标准交流模版进行信息传递误差率很小。全自动翻译系统的翻译准确率一般只能达到70%左右。这种准确率如果是天气预报,我们已经习惯接受。而对于语言信息传递,30%的误差率却是难以接受的。一个关键词的翻译错误,可能会导致不可思议的严重后果。由于是全自动翻译系统,即使用户要求从新翻译一遍,也将错误依旧。
所谓方便,就是用户只需懂得母语,就可以和持各种不同语言的人们进行交谈,并且交谈内容可以不受任何限制。
另外,既然持不同自然语言的用户可以直接阅读交流模版上的信息,那么,也就可以自己动手,将它改写成各种流畅的自然语言。
(2)交流模版可以与各种自然语言处理及机器翻译技术接口。从交流模版的角度看,通过与机器翻译技术接口,不仅选词和组句速度可以明显提高,而且可以像多种自然语言表达形式进行自动转换。从机器翻译的角度看,交流模版提供了消除自然语言词汇歧义、句法歧义和非规范表达的多语通用手段。因此,以交流模版作为机器翻译操作平台,译文质量与现有技术相比将得到大幅度提高。
由于自然语言的多义性,即使机器翻译源语或交流模版表达式没有歧义,在通过机器翻译技术转换为自然语言后,随时可能产生新歧义。这时,凡是采用交流模版作为开发平台的机器翻译系统,均可以由译文用户调用信息输入方的模版表达式,用多种语言进行信息查询。这为多语信息交流的可靠性提供了前所未有的技术保证。
(3)以交流模版为平台的机译软件具有多语双向互译的先天优势,不仅每一种以交流模版为平台的机译软件可以独立开发,而且每开发一种以交流模版为平台的机译软件,均可以与其它相同平台的机译软件自动连通。因此,我们将语言信息交流模版比喻为编程领域JAVA。如果JAVA的优势在于“一次编程,任意运行”,那么,交流模版机译系统的根本优势在于“一次编码,任意翻译”。
七、统一编码技术的产品化方案
1、语言信息交流模版
标准的语言信息交流模版为各种自然语言提供统一的内部词典库、语法数据库、词汇概念准入和语法表达的标准界面。
多语交流模版的开发成本低、速度快,因此可以很快投入市场,以解决因特网多语交流的燃眉之急。
世界各地持不同自然语言的用户,都可以采用交流模版进行人际交流(面对面和远距离均可)。因此,在各种公共场所安装这种供多语信息交流的触摸式模版,将会为多语人际交流提供方便。
机器翻译系统开发商可以买下某一语种的统一编码交流模版使用权,开发统一编码机器翻译系统。
掌握统一编码核心技术的企业,则可根据自然语言发展的实际情况和用户需求,适时推出新的统一编码标准版本,不断提高和保障统一编码技术的市场适应性。
2、统一编码多语互译软件
在因特网上的圈地运动中,质量可靠的多语互译技术是一种重要的基础技术。由于统一编码交流模版易学、实用,并且只需懂得母语既可进行操作,模版交流操作员可以像文字录入员一样成为一种新的普及性职业。将客户需求和机译小姐进行及时连接的机译在线服务商,通过远比人工翻译价格便宜,又比全自动机译系统翻译质量可靠的机译服务,将在这一新领域得到丰厚的市场回报。
只擅长或只熟悉母语的网络用户,可以在10多个小时的自学之后,采用交流模版上网发布信息和传递电子邮件,接受方则可以采用不同语言的解码软件解读交流模版信息。
世界各地的网络在线服务商,都可以以低成本雇佣只懂母语但擅长统一编码的操作员,将在线服务信息进行一次性的统一编码,供不同语种用户访问,以打开在线服务的广阔国际市场。
3、交流模版解码软件
一些用户可能对自己采用交流模版进行编码操作不感兴趣,但希望能够阅读经过交流模版统一编码处理的网上信息。拥有交流模版机译系统的公司,可以为此类用户提供自动解码软件,将以交流模版统一编码形式在网上传递的语义信息,解码为普通用户看得懂的多种自然语言,使用户不需要任何学习成本即可浏览。
4、统一编码多语互译专业机译软件
随着世界经济的一体化,越来越多的产品、技术和服务正在涌入国际市场。因此,统一编码机译系统在网络世界之外的专业领域也将拥有广阔的应用前景。只要配上各种专业词库,以统一编码为基础的多语互译专业机译软件,在翻译多种语言的产品说明书、专业信息的多语交流,甚至在制定技术文件、合同的多文种版本方面,都可表现出独特优势。因为排除了多义性并可查阅中间结果的统一编码机器翻译文件,除了翻译成本低之外,比人工翻译的自然语言文件在语义表达的明确性方面也将更胜一筹。

八、信息社会未来语言的发展
语言作为人类生存最重要的工具,对任何人而言,其重要性恐怕都仅次于生身父母。因此,语言的发展变化的确值得我们预测和关注。
笔者认为,在21世纪,将会有3类重要的语言并存在这个世界上:第一,当然是自己的母语,它将保证你基本的生存能力;第二,面向计算机技术的通用交流语言,它将以最低的学习成本和最广的交流范围,保证人类中的大多数人有机会成为信息社会的合格公民;第三,英语。它将可能在职业选择和人际关系发展方面,使你更具优势。同时,这三类语言会相互影响、协同发展,将人类带入一个更加多姿多彩也更秩序井然的语言新天地。当然,这一天的到来不会是天上掉馅饼,它将有一个过程,并且需要我们大家共同努力。



  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值