本体学习的概念及目标

本体建造是一个非常复杂的过程,它需要多个领域的专家参与。虽然目前本体工程(Ontology Engineering)工具已经较为成熟,但本体的手工构造仍是一项繁琐而辛苦的任务,并最终导致所谓的知识获取瓶颈。而且,本体具有任务相关(task-dependent)和静态性(static)的特征。

从目前本体工程的实践来看,本体的构建和维护主要存在如下问题:第一,在构建的初期和维护阶段需要花费大量的人力,包括构建实际的分类体系(Taxonomy),以及将某一特定内容与分类体系中的节点关联起来。例如,在YahooDMOZ开放目录中包括分层目录和与某一目录相关的站点。第二,本体中俘获的知识是流变的(Evolution),它总是在不断地发展和更新。为避免本体成为过期的无用信息,这就意味着本体不能象字典一样以手工方式构造,否则它的发布之日就已过时。第三,本体中的分类体系具有领域相关性,特定学术或商务专业领域有其自身的词汇表和技术术语,因此构造合适的通用本体或分类体系需要大量的修剪和编辑时间。第四,本体反映了客观世界的某一特定观点,它反映了构建者个人或机构的观点。第五,本体作为一种共享概念模型,但通常很难以某种特定的方式来对客观世界分类。

本体学习(Ontology Learning)技术可以说当前的一个热点[4]。其目的旨在开发能够实现本体自动构建的机器学习技术来协助知识工程师来构建本体,基本原理如图1所示。本体学习任务主要包括:(1)本体获取:包括本体创建、本体模式(schema)抽取和本体实例(instances)抽取。(2)本体维护(Ontology maintenance):包括本体集成和导航、本体更新以及本体扩充(enrichment)。

本研究的主要目标是:从Web文档中自动获取领域术语及其相互关系;采用信息抽取(IE)技术来确定概念对之间的语义关系,在获取的概念及其相互关系的基础上,构建本体。经过系统所获取的Web本体目标不仅仅局限于逻辑学的学术范畴。语义描述要能够为计算机方便利用,因此,并不追求语义的完整和深入,只求语义表达的可扩展性。它的任务是把共同约定、共同享用的知识(词语的语义规范),用计算机容易处理的形式表达出来。

转载于:https://www.cnblogs.com/todaysgp/archive/2008/03/03/1089351.html

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值