【Semantic Web】从G. Antoniou等人视角看语义网(一)语义网愿景

       高速发展的万维网已经成为人类历史上影响最深远、最广泛的信息传播媒介,同时也推动着下一代万维网技术的发展。1998年,万维网的发明人Tim Berners-Lee 提出了语义网(Semantic Web)的设想。2001年,《科学美国人》杂志刊登题为“The Semantic Web”的科普文章,宣告了语义网的诞生。同年,万维网联盟(W3C)成立了一些列工作组,致力于指定语义网技术规范。随着资源描述框架(RDF)、万维网本体语言(OWL/OWL2)、RDF查询语言(SPARQL)及规则交换格式(RIF)等一批技术规范被确立为推荐标准,语义网为万维网上的知识表示、推理、交换和复用奠定了基础。随之而来的是语义网技术在众多领域的蓬勃发展和广泛应用。
 
——A Semantic Web Primer,Third Edition,机械工业出版社,译者序

学习笔记:G. Antoniou, Paul Groth et al. A Semantic Primer,Third Edition.

语义网动机及设计方案

       简单来说,语义网的产生主要是为了是计算机有能力解读万维网上的信息(to make the web more accessible to computers)。当前,网络信息检索之后的信息选择、组合、聚集等工作必须由人本身来完成。从这个角度看,计算机在整个过程中扮演的角色确实十分有限:索引关键字,将信息从服务器端传输到客户端,仅此而已。语义网希望使得万维网更适合及其处理,使得万维网上充满机器可读取、可理解的数据。这样,搜索将不再局限于关键字,而将变得更加语义化。
       语义网遵循如下设计原则:

  1. 使得结构化和半结构化的数据以标准化的格式在万维网上可用;
  2. 不仅制造数据集,还创建万维网上可解读的个体数据元素及关系;
  3. 使用形式化模型来描述这些数据的隐含语义,使得这些隐含语义能够被机器处理。

       这些设计原则已经被转化为实际的技术:

  1. 使用带标签的图(labeled graph)作为对象及其关系的数据模型,图中将对象作为节点,对象间的关系表示为边。使用资源描述框架(Resource Description Framework,RDF)的形式化模型来表示这种图结构。
  2. 使用万维网统一资源标识符(Uniform Resource Indentifier,URL)来标识出现在数据集中的单个数据项以及它们之间的关系。
  3. 使用本体(Ontology)作为数据模型来形式化地表达数据的隐含语义。诸如RDF模式(RDF schema,RDFs)和万维网本体语言(Web Ontology Language,OWL)的形式化模型。

       为了正确的捕捉数据的隐含语义,诸如RDFs和OWL的形式化模型不仅是数据描述语言,实际上还是轻量级的知识表示(knowledge representation)。

语义网技术

  1. 元数据(metadata):关于数据的数据。元数据捕获数据的含义 部分,也就是语义网中所说的语义(semantic)一词。
  2. 本体(ontology):一个本体是一个概念体系的一种显示的、形式化地归约(An ontology is an explicit and formal specification of a conceptualization)。这里使用T. R. Gruber的定义,后来由R. Studer修订。通常,一个本体形式化地描述了一个论域。
  3. 逻辑:一般而言,逻辑首先提供形式语言来表达知识。其次,逻辑为我们提供广泛理解的形式语义(well-understood formal semantics)。
  4. 人工智能:显然,要实现语义网愿景,所需的大部分技术是建立在人工智能领域工作基础上的。

语义网的一个分层方法

语义网的一个分层方法
                     图1 语义网的一个分层方法

  1. 1.Unicode和URI层:语义网的最底层。Unicode用来定义国际化、通用化的字符集。URI是统一资源标识符(Uniform Resource Identifiers)的缩写。在语义网环境中,所有需要描述的事物都称之为资源,而每一个资源都用唯一的URI标识。
  2. XML+NS+xmlschema层:语义网的基础描述语言层。XML是语义网层次模型的基础,它是网络最通用的标签式描述语言,命名空间(Name Space)为XML文档中的结构化标记的定义和使用提供上下文机制,用以指明涵义,避免命名冲突。XML Schema为XML文档提供了语法结构上的约束,保证XML文档的完整性与有效性。
  3. RDF/RDF Schema层:RDF资源描述框架[53](Resource Description Framework)是一种用于表达网上资源的语言。RDF层的功能就在于表达丰富的网上信息资源,是构建语义网这栋大厦的砂石砖块。RDF Schema则为RDF更丰富的结构表达提供了一套类型定义系统。
  4. 本体(Ontology)层:本体技术是语义网的核心。本体的功能就是提供网上互操作体之间关于信息的共同理解,也就是“语义”。在语义Web的交互中,本体担当着语义互操作的重要角色。实践中,用RDF定义了网上信息资源,再用本体定义了互操作的语义空间,就构成了一个基本的语义网应用环境。这一层有时还包括规则(Rule)子层。加入规则子层,可以提高本体描述能力,增强信息的语义表达能力。规则子层还可以定义与具体应用相关的知识描述,提供个性化的私有描述。
  5. 逻辑(Logic)层:该层用以提供公理和推理规则,为智能推理提供基础。
  6. 证明(Proof)层:证明层用于提供认证机制,执行逻辑层产生的规则。
  7. 信任(Trust)层:主要负责提供信任机制,保证资源的交互安全可靠。
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值