计算机处理自然信息的过程,自然语言在信息处理中的应用

【摘 要】自然语言信息处理是人机交互的关键技术,已得到高速的发展。论文首先论述该技术的起源和发展,然后重点研究该技术在文本和语音方面的广泛应用。可以预测计算机技术的进一步发展,自然语言信息处理技术将被广泛应用于各个领域。

【关键词】自然语言;处理;语言翻译;人工智能

一、引言

自然语言处理是计算机科学领域与人工智能领域中的一个重要研究方向。它研究的主要内容是能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有着密切的联系,但又有重要的区别。

近年来随着计算机技术和人工智能的快速发展,自然语言信息处理技术已取得了长足的发展。于此同时人们在快速信息检索、语言翻译、语音控制等方面的需求也越来越迫切。如何将自然语言处理中取得的研究成果应用于文本、语音等方面已成为目前应用研究的一个关键。

二、自然语言信息处理技术简介

语言是信息的载体,也架起了人与人之间交流的桥梁,语言好比一条公路,架起了交流的纽带。语言处理技术已经日益成为全球信息化和我国社会和经济发展的重要支撑性技术。计算机自然语言处理是用计算机通过可计算的方法对自然语言的各级语言单位(字、词、语句、篇章等等)进行转换、传输、存贮、分析等加工处理的科学,是一门与语言学、计算机科学、数学、心理学、信息论、声学相联系的交叉性学科。

自然语言信息处理技术产生于上个世纪40年代末期,它是通过采用计算机技术来对自然语言进行加工处理的一项技术。该技术主要是为了方便人与计算机之间的交流而产生的。通过多年的发展,该项技术已取得了巨大的进步。其处理过程可归纳为:语言形式化描述、处理算法设计、处理算法实现和评估。其中,语言形式化描述就是通过对自然语言自身规律进行研究,进而采用数学的方法将其描述出来,以便于计算机处理,也可认为是对自然语言进行数学建模。处理的算法设计就是将数学形式化描述的语言变换为计算机可操作、控制的对象。处理算法实现和评估就是通过程序设计语言(如C语言)将算法实现出来,并对其性能和功能进行评估。它主要涉及到计算机技术、数学(主要是建模)、统计学、语言学等多个方面。

大约90年代开始,自然语言处理领域发生了巨大的变化。这种变化的两个明显的特征是:

(1)对系统输入,要求研制的自然语言处理系统能处理大规模的真实文本,而不是如以前的研究性系统那样,只能处理很少的词条和典型句子。

(2)对系统的输出,鉴于真实地理解自然语言是十分困难的,对系统并不要求能对自然语言文本进行深层的理解,但要能从中抽取有用的信息。

三、智能应用

(一)自然语言信息处理在文本方面的智能应用

在文本方面,自然语言处理技术主要应用在语言翻译、字符识别、文本信息过滤、信息检索与重组等方面。其中,语言自动翻译是一个十分重要并具有极大现实意义的项目。它涉及到计算机技术、数学建模技术、心理学以及语言学等多个方面的学科。通过近些年的努力已得到了一定的发展。自然语言处理技术已在多个方面提升了翻译的效率和准确性。如自然语言处理中的语言形态分析与歧义分析对翻译技术来说十分重要,可以很好的处理翻译中的多意现象和歧义问题,从而提高翻译的准确性。字符识别具有广泛的商业应用前景,它是模式识别的一个分支。字符识别的主要过程可分为预处理、识别以及后期处理。目前,字符识别已得到了广泛的应用,并且效果良好,但还存在识别不准确的问题,其主要问题就出在合理性上,其中后期处理就涉及到采用词义或语料库等对识别结果进行合理性验证,通过该技术就能很好的解决识别不准确的问题,当出现识别不准确、出现多个识别结果时可以通过合理性验证技术高效的过滤掉异常选项,从而实现快速、准确的识别。如果能进一步的研究自然语言信息处理技术,将能实现信息的自动获取与重组,这样将能实现自动摘要生成、智能文本生成、文件自动分类与自动整理。若能进一步结合人工智能技术,将能实现文学规律探索、自动程序设计、智能决策等诸多方面的应用。这样可以减轻人类的工作强度,让我们从繁琐的基础工作中走出来,拥有更多思考的时间,从而能更加有效的推动技术的进步。

(二)自然语言信息处理在语音方面的智能应用

在语音方面,自然语言处理技术主要应用在自动同声传译、机器人聊天系统、语音挖掘与多媒体挖掘以及特定人群智能辅助系统等方面。其中,自动同声传译主要涉及到语音建模、识别以及语言翻译等方面,采用自然语言处理技术可以对自动同声传译的每个方面都能得到提高,最直接的部分就是语言翻译部分,同时还可能涉及到语音与文本的转换。特别是在语音和文本的转换方面,目前在中文出来中出现的一个问题是音似问题,即音似字不同的情况,对这种情况如果能采用自然语言处理技术来对其进行校验,将能提高其转换的效果,从而提高转换的质量和准确性。机器人聊天系统涉及到更加广泛的内容,如自动回答系统。

在语音挖掘与多媒体挖掘方面,自然语言处理技术的应用主要体现在增强意义理解和提高检索速度这两个方面。通过该技术一方面能根据准确的获取语音所包含的意义,从而为搜集信息提供基础。同时,由于采用该技术也有助于数据挖掘中的对相关信息的检索和归纳。

随着人工智能、计算机视觉等技术的快速发展、自然语言处理技术将能应用于诸如自动场景解说系统等。也就是自然语言处理技术再结合图像理解技术和逻辑推理技术,就能准确的描述当前场景发生了什么事情,如果能和上一个场景进行比较就能及时的描述场景的变化,并通过有效的组织就能实现对场景的自动描述。再进一步利用人工智能技术、知识库及语音生成技术就能实现场景的自动解说,甚至能实现如自动足球运动这样快速场景变换的解说。

四、结论

近年来自然语言处理获得了巨大的发展,其关键技术也获得了突破。该技术所开发的新技术能对文本处理与语音业务处理产生广泛而深远的影响。目前,可以肯定的是自然语言处理技术能对文本处理与语音处理在建模、识别、理解方面将产生极大的作用,甚至可以预测随着该技术的进一步发展,将对多媒体技术及应用起到重大的作用。如果经过进一步的开发,该技术将能对目前控制方式产生较大的影响。

【参考文献】

[1]王丁,李向宏,王鑫.机器翻译转换生成研究[J].信息技术,2002(6):68-70.

[2]周会平,王挺,陈火旺.汉英翻译系统IcENT的中间语言设计[J].计算机研究与发展,2000,37(3):336-343.

[3]侯志霞,曹军.自然语言处理的发展概况及前景展望[J].山东外语教学,2003(5):53-55.

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值