计算机应用技术 自然语言处理,基于词联接的自然语言处理技术及其应用研究-计算机应用技术专业论文.docx...

中文摘要摘

中文摘要

摘要

随着人类社会信息化程度和计算机软硬件水平的提高,自然语言处理(Natural

LanguageProcessing,简称NLP)技术逐渐成为计算机应用和人工智能研究的热点, 其基本技术目标是让计算机具有类似人的语言智能,例如能够象人一样听、说、 读、写。围绕NLP技术逐渐形成了一个专门的学科——计算语言学。该学科属于 交叉学科,涉及到语言学、心理学、心理语言学、脑科学、计算机科学、哲学、

逻辑学、人工智能、数学、信息论、文学、美学等诸多学科或领域。从上个世纪 中叶以来,虽然不同学科和领域的无数研究者投入了大量的研究资源,探索出了 一些有效的技术,取得了一定的成果,但离实现基本技术目标还显得非常遥远。 值此世纪之初,有必要从更高、更深的层面重新审视NLP技术的研究背景、目标 和途径,在继承现有技术的基础上大胆创新,探索出切实可行、面向未来的新技 术。本文在这个方向上作出了努力,以抛砖引玉,促进NLP技术的发展。

在国家自然科学基金项目“计算机辅助文学艺术创作研究——诗词曲联”

2002~2004)的支持下,在深入分析NLP技术背景的基础上,本文 提出并初步构建了基于词联接的NIP技术(Term Connection Technique for NLP, 简称TCT),并应用到诗词语言处理系统(PoetryProcessing System,简称PPS) 中。理论研究和应用研究的结果表明,TcT是一种继承并发展已有技术、高度综 合与包容、操作性强、有效的NLP技术。本文的主要内容包括:

第1章介绍了TCT的技术背景,包括NLP的根本难点、现阶段NLP的根本 目标、NLP技术的发展阶段和趋势,提出了一系列较为独特的观点。NLP的根本 难点在于自然语言具有认识性和不确定性,现阶段目标应是受限语言智能仿知技 术。这一目标是在分析了NLP根本难点、现阶段的计算机技术、已有人工智能和

NLP研究成果的基础上提出来的,因此是切实可行的。NLP技术分为技术探索、

规则技术兴起、统计技术兴起三个阶段,主要发展趋势是实例技术可能成为主流 技术,规则技术和统计技术可能成为辅助技术。

第2章介绍了TCT的基本原理、技术结构、哲学基础、理论基础、方法基础, 从宏观上初步构建了TCT。TCT的基本原理是基于受限自然语言环境建立动态语 料库,基于动态语料库建立词联接实例知识库和高级知识库,基于知识库进行受 限自然语言处理。TCT具有完整、简明、合理的技术结构,包括:TCT知识表示 技术(TCTR)、TCT知识获取技术(TCTO)、TCT语言分析技术(TCTA)、TCT 语言评价技术(TCTE)、TCT语言生成技术(TCTC)、TCT语言修改技术(TCTM)、 TCT语言输入输出技术(TCTIO)。TCT的哲学基础是易学,这是本学位论文最具

重庆大学博士学位论文特色的地方。易学是中国古代哲学的精华.具有朴素的唯物辩证思想和系统观,

重庆大学博士学位论文

特色的地方。易学是中国古代哲学的精华.具有朴素的唯物辩证思想和系统观, 对于认识和认识建模都具有很强的指导作用。TCT的理论基础是神经认知语言学, 该理论强调语言理论不悖于大脑神经事实,综合了联接主义和符号主义等理论的 长处,是一种面向NLP的语言学理论。TCT的方法基础是基于实例的知识加工, 以实例为基础,可以更好地综合各种知识加工技术。

第3、4、5、6章分别介绍了TCT技术结构中的TCTR、TCTO、TCTA、TCTE, 从微观上初步构建了TCT。由于研究资源有限,本文在斟酌各个技术模块关系的 前提下,着重研究这四大模块。在每个技术模块的研究中都注意继承与创新相结 合,注意各个技术模块在功能上的独立性与系统性。与传统的NLP技术相比较, 各个技术模块都具有各自的特色和创新点:在TCTR中提出了自然语言知识结构 和要素、抽象概念树(Abstract Concept Tree,简称ACT)、体验语义和价值语义等: 在TCTO中提出了语言知识设计、语料标注规范、语言知识获取与管理等;在TCTA 中提出了词联接最大语义符合度计算和最优句树搜索的初级语言分析算法;在 TCTM中提出了豪放与婉约语言风格的计算模型。

第7章介绍了基于TCT的PPS开发和测试。由于构建TCT之初就认识到了 自然语言认识性中的体验性这一难点,而体验性是自然语言尤其是文学语言的重 要特征,因此TCT应当能够比传统的NLP技术更好地处理文学语言。诗词语言是 一种典型的文学语言,开发PPS对传统的NLP技术和TCT都是一种挑战。本文 基于当前水平的TcT开发了PPS,完成了语言知识类设计、语言知识库设计、模 块设计、界面设计,并在大量数据准备工作的基础上进行了诗词语料标注测试、 诗词语言

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值