浅谈语义网

ž 前言  随着信息技术的飞速发展,网络空间中了出现大量的数据资源,网络大数据逐渐引起了人们的关注,然而从网络大数据中发现并获取用户所需的数据资源,需要对网络大数据进行有效地组织管理,并进行基于数据语义的相似搜索。传统信息检索信息资源缺少统一的语义描述,用户难以查找到与需求相关的资源,出现了查找精确度低的现象,针对这一缺陷,实现语义级的信息检索的研究成为目前研究的热点。  随着人工智能技术
摘要由CSDN通过智能技术生成


ž 前言

  随着信息技术的飞速发展,网络空间中了出现大量的数据资源,网络大数据逐渐引起了人们的关注,然而从网络大数据中发现并获取用户所需的数据资源,需要对网络大数据进行有效地组织管理,并进行基于数据语义的相似搜索。传统信息检索信息资源缺少统一的语义描述,用户难以查找到与需求相关的资源,出现了查找精确度低的现象,针对这一缺陷,实现语义级的信息检索的研究成为目前研究的热点。

  随着人工智能技术在人类生活中的应用越来越广泛,基于人的情感基础、思考方式的信息检索方式将是未来发展的趋势,而普适计算等一系列新兴技术的出现与兴起,为语义网的发展提供了技术支持与更高的要求,使语义网能够在大数据时代更好地为人类社会服务,更加贴近于人类的生活,使人类达到更高层次的智能生活。

  本文将在博取众家之长的基础上向大家介绍关于语义网的发展背景、概念与定义、现阶段应用、研究现状以及在大数据时代下语义网的发展。由于本文只是对语义网进行一个初步的研究,并不涉及任何个人研究内容,若与引用文献内容有出入,以引用文献为主。

ž 发展背景

  随着信息技术的不断发展,我们迎来了一个数字信息极速膨胀的时代,这主要是数字文档信息的组织、处理和搜索相关问题而引起的信息过剩。由于相关技术的发展速度似乎落后于网上内容量的增长速度,虽然信息检索有搜索引擎的辅助,但用户在网上搜索相关信息的过程是极其复杂的,因为同一个搜索关键词可能会涉及很多个领域,从而会得到不同的答案,所以会出现用户通常不完全满意想要查询的结果。从实际来看,用户想要精确的结果,需要花费相当多的时间来完成检索,也就是说用户并不能在较短的时间内找到自己想要查找的内容。之所以会有这样不合理的现象出现,是由于传统的搜索引擎仅有几种返回结果的方法,快速检索往往返回的结果是大量的网页,没有经过细致的筛选,不符合用户的查找标准,所以并不是用户想要查找到的精确的答案。

  万维网创始人Tim Berners-Lee将万维网的演化分为两个阶段,在第一个阶段,万维网应该是一个有利于人们相互合作的强大工具。万维网最初十年的发展基本上实现了这个目标:它以HTML页面的方式向人提供了大量的信息。在第二个阶段,这种合作应该延伸到机器,也就是说连接到万维网上的机器也应该能够分析万维网上的所有数据——包括内容、链接以及人与机器之间的交互。如何实现万维网的第二阶段目标正是目前学术界研究的热点。

  实现这一目标的难点在于传统的HTML语言本身的固有缺陷,这种标记语言的标签集只是对内容的显示格式做了标记,数据的表现格式和数据糅合在一起,缺乏针对数据内容的标签。HTML语言的这种特点决定了万维网上的信息内容很难被机器所理解,从而制约了一些需要对万维网上的海量数据进行自动化处理应用的开发。例如:搜索引擎很难在查准率和查全率这两方面有所突破,搜索到的页面也只是和搜索关键字相匹配的页面,造成一方面遗漏大量内容相关的页面,另外一方面找到太多不相关页面;一些对万维网页面内容的提取程序只能针对特定站点的固定格式,从中提取一些感兴趣的信息,如果站点的格式稍有变化,内容提取程序也要做相应的调整。虽然近年来在自然语言处理(NLP)、机器学习等领域对文本内容的理解等方面做出了大量的努力,提出了基于概率、向量空间等各种方法来加强对文本相关性的理解,但是从效果上看,还很难让人满意。Web上海量的数据要求以一种能够理解数据语义的方式进行交换和管理,当前基于HTML的web技术却很难满足要求。

  针对传统信息检索方式的不足,专家们提出了一条新的途径来解决,即用一种更容易被机器处理的表示方法来描述网上内容。这个革命性方案称为“语义网”运动。语义网并不是与现有万维网平行的、新的全球化信息高速公路,它将在现有万维网的基础上组建成长,利用万维网的基础发展更适合于人类社会的检索方式。语义网的目标是为因特网上的信息提供具有计算机可以理解的语义,它的发展和成熟使得高效高质的语义信息检索成为可能。

ž  概念与定义

  语义网就是指能够根据语义进行判断的智能网络,实现人与电脑之间的无障碍沟通。它好比一个大规模大脑,智能化程度极高,协调能力非常强大,能够理解人类的意图、与人类进行交流。在语义网上连接的每一部电脑不但能够理解平面化的词语和概念,而且还能够理解它们之间的逻辑关系,从而达到人类的逻辑思维能力。语义网中的计算机能利用智能软件,在万维网上的海量资源中对数据进行筛选与分析,并最终找到你所需要的信息,而在这基础上需要的是将海量资源进行整合,从而将一个个现存的信息孤岛发展成一个巨大的数据库。

  语义网的数据主要供人类使用,新一代WWW中将提供也能为计算机所处理的数据,这将使得大量的智能服务成为可能;语义网研究活动的目标

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值