语义网简介(非应用)

语义网

简介

语义网(Semantic Web)的核心是:通过给万维网上的文档(如: HTML)增加能够被计算机所理解的语义(Meta data),从而使整个互联网成为一个通用的信息交换媒介。换言之,就是构建一个能够实现人与电脑无障碍沟通的智能网络。打破现阶段万维网面向文档、信息孤岛等问题。

举栗:输入“下午两点我要吃饭”。目前搜索引擎反馈的结果是百度、寻医问药一类,而语义网则会为你寻找饭店信息或是菜谱信息。

语义网堆栈

语义网堆栈

超文本网络技术

堆栈图中的底部层面,包括超文本网络方面众所周知的那些技术以及一些未加改动的技术,奠定了语义网的基础。

  • 国际化资源标识符(Internationalized Resource Identifier,IRI),作为URI的泛化形式,提供的是对语义网资源加以唯一标识的手段。为了能够在顶部层面之中实现对于资源的可验证的操作处理,语义网需要唯一性标识机制。

  • Unicode旨在采用多种语言来表现和处理文字。语义网也应当在采用不同人类语言的文档之间建立桥梁和纽带,因而语义网应当能够采用Unicode来表现这些多语言文档。

  • XML是一种标记语言(置标语言),使得我们能够创建由结构化数据构成的文档。语义网将把含义赋予结构化数据。

  • XML名称空间提供的是一种利用不同来源之标记(置标)的手段。语义网正是打算将数据联系起来,因而需要在一份文档直至引用更多的原始资料。

标准化语义网技术

中间的那些层面包含的是那些W3C已经加以标准化的技术,旨在使语义应用程序得以构建。

  • 资源描述框架(Resource Description Framework,RDF)是一种框架,用于采用一种称为三元组的形式来创建声明。RDF使得我们能够采用图形的形式来表达资源的有关信息,因为语义网有时又被称为“Giant Global Graph”(巨大全球图,GGG)。这个还能接受,其实用XML去表述的话已经很复杂了。如果有天改为json就会好很多。

  • RDF Schema(RDF模式,RDFS,RDF-S)旨在为RDF提供基础词表(基本词汇)。例如,采用了RDFS,就有可能创建出由类和属性组成的层级结构。

  • 网络本体语言(Web Ontology Language,OWL)通过添加更多用于描述RDF声明之语义的构造(结构),从而对RDFS进行扩展。OWL允许声明额外的约束,如基数、取值的限制,或者可传递性之类有关属性的特征。OWL建立在描述逻辑的基础之上,因而为语义网带来了推理能力。这块内容简直是魔鬼,为了推理而构建的逻辑关系让人欲仙欲死……

  • SPARQL是一种RDF查询语言。SPARQL可用于查询任何基于RDF的数据(也就是说,包括那些涉及到RDFS和OWL的声明)。要从语义网应用程序那里检索信息,查询语言是不可或缺的要素。

尚未实现的语义网技术

顶部层面则包含的是那些目前尚未实现标准化的或者仅仅包含的是为了实现语义网而应当加以实现的想法或概念。

  • 规则交换格式(Rule Interchange Format,RIF)或SWRL将实现对于规则的支持。这一点具有重要意义,比如对于描述那些OWL之中所采用的描述逻辑所无法直接描述的关系来说就是如此。

  • 密码学对于确保和验证语义网声明来自于值得信赖的可靠来源方面具有重要意义。借助于RDF声明适当的数字签名,即可实现这一点。

  • 对于派生出来的声明的信任将会得到两个方面的支持:(a) 验证前提来自于可信赖的原始资料;(b) 在派生新的信息之时依赖于形式逻辑。

  • 用户界面,作为最后的层面,将使人类用户能够使用语义网应用程序。

现状(2018.3为止)

到目前为止,语义网的建立仍然处于打地基的阶段。尽管能看到一些应用,比如:个性化服务-TWINE(已凉),语义搜索-Powerset(已凉),知识库-Wolfram Alpha(www.wolframalpha.com,可以一玩,很慢)、BabelNet、DBpedia。但是整个语义网距离彻底建立还有很遥远的路要走。我个人认为现在停留在为现有的互联网资源打标注(写资源描述)的阶段,目前已有的本体和个体并不能满足。

后续仍然存在两大难题:

  1. 数据网络的实现:建立一个全网数据库让数据流通起来。不仅要求共享交换资源描述,还需要寻找一个方式去统一管理资源描述,一方面是为了整合资源描述从而构建关系网络,另一方面是为了后续逻辑推理打下基础。(雅虎正在做这件事)

  2. 自动推理系统的实现:巨大的数据输入、用户模糊的用词、推断种类不确定性、欺骗信息等问题,都使得语义网自动推理系统的构建难上加难。

示例

可以在以下英文搜索引擎地址输入”who created python”,中文搜索引擎输入”谁发明了电灯”。(当然,中文搜素的确是很有难度的一件事。),感受一些有语义的搜索引擎和无语义的搜索引擎有什么区别。

bing国际版(结合了Powerset):https://cn.bing.com/?ensearch=1&FORM=BEHPTB

google:https://www.google.com/

wiki:https://www.wikipedia.org/

百度:https://www.baidu.com/

复旦实验室:http://shuyantech.com/qa

  • 1
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值