语义网概述
当前的web:
取得了巨大的成功
产生了海量的数据
有了用于结构化数据传输的标准语法(XML)
大量机器可处理,人类可读的文档
当前的Web存在的问题
信息太多但是结构化太少
信息多为满足人类消费(使用)
Web内容多为异构
in terms of content 内容异构
in terms of structure结构异构
in terms of character encoding 编码方式异构
future requires intelligent information integration未来需要智能化的信息集成
人类可以从给定的信息片段演绎推理出隐藏的信息
但是目前的Web能处理文档中的语法
需要自动推理技术
语义网定义
语义网就是一种描述网络Web数据,具有模型语义,并且在一定程度上支持语义推理的知识表示方法。
基本组成
- 描述Web信息的开放标准
- 从Web描述信息中进一步获取语义的方法
主要方法: 逻辑演绎 (又称自动推理——automated reasoning)
三段论:
E.g.,
D.C. is a capital
Every capital is a city
-------------------------------
Hence: D.C. is a city
语义Web基本思想
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-4oWBMe2p-1637587710517)(C:\Users\Joseph\AppData\Roaming\Typora\typora-user-images\image-20211121122720876.png)]
什么是本体(Ontology)
本体是指一种“形式化的,对于共享概念体系的明确而又详细的说明”。
本体提供的是一种共享词表,也就是特定领域之中那些存在着的对象类型或概念及其属性和相互关系;
或者说,本体就是一种特殊类型的术语集,具有结构化的特点,且更加适合于在计算机系统之中使用;
或者说,本体实际上就是对特定领域之中某套概念及其相互之间关系的形式化表达(formal representation)。
本体的核心通常是分类体系
事物的类,以层次结构进行组织(Taxonomy)
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-mr3r7yp9-1637587710519)(C:\Users\Joseph\AppData\Roaming\Typora\typora-user-images\image-20211121134419765.png)]
事物的类,按照“部分-整体”形式构造层次结构 (Partonomy)
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-KOA3Z9LS-1637587710520)(C:\Users\Joseph\AppData\Roaming\Typora\typora-user-images\image-20211121134526941.png)]
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-7ksRBO9u-1637587710521)(C:\Users\Joseph\AppData\Roaming\Typora\typora-user-images\image-20211121134546102.png)]
semantic web由tim berners-lee于1998年提出
1989年tim berners-lee发明万维网
semantic network于1960年发明
RDF
组成
- URIs
– for referencing resources 可以清楚地区分资源
- Literals 文字
– data values 数据值
• 表示数据的值 for representing data values
• 采用字符串进行编码 encoded as strings
• 值通过数据类型进行解释 interpreted by means of datatypes
• 没有数据类型的字面体当做字符串进行处理 literals without datatype are treated the same as strings
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-0nZhJl27-1637587710522)(C:\Users\Joseph\AppData\Roaming\Typora\typora-user-images\image-20211121135601837.png)]
- Empty nodes 空节点
– 没有命名的节点(or the name of which isn’t known)
RDF
• 表示图有多种可能
• 一个图表示一系列的三元组(点-边-点)
• 一个三元组包含:
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-H86TcVPe-1637587710523)(C:\Users\Joseph\AppData\Roaming\Typora\typora-user-images\image-20211121135749766.png)]
规则:
–主语 : URIs 和空节点
– 谓语: URIs (通常被称为属性properties)
– 宾语: URIs 、空节点或文字Literals
注:可以从一系列三元组重构图
语法
turtle语法
XML序列化
Turtle 易于读写 ,但是不是实践中最常用的RDF语法。
RDF的主要语法是基于XML的。
Turtle不是W3C推荐的。
RDF的规范化语法是其XML语法
RDF的XML-based语法
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-HHbicsyk-1637587710524)(C:\Users\Joseph\AppData\Roaming\Typora\typora-user-images\image-20211121141054351.png)]
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-B8t2qItu-1637587710524)(C:\Users\Joseph\AppData\Roaming\Typora\typora-user-images\image-20211121141137961.png)]
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-C8HoczDh-1637587710525)(C:\Users\Joseph\AppData\Roaming\Typora\typora-user-images\image-20211121141322754.png)]
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-34dRkEVt-1637587710525)(C:\Users\Joseph\AppData\Roaming\Typora\typora-user-images\image-20211121141613905.png)]
RDF的XML语法
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ZITCV2DN-1637587710526)(C:\Users\Joseph\AppData\Roaming\Typora\typora-user-images\image-20211121141818118.png)]
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-7jUI71V7-1637587710526)(C:\Users\Joseph\AppData\Roaming\Typora\typora-user-images\image-20211121141826253.png)]
小结
• 什么是语义网,从WEB到语义网
• 什么是本体,本体的作用
• 资源描述框架RDF,TURTLE语法与XML-based语法
• 实验:掌握RDF框架语言的基本语法
RDFS及其形式语义
RDFS
1.动机
RDF可用于表示事实,为表示更一般化的知识(模式(Schema)知识或术语化知识)
RDF Schema允许我们进行模式知识建模,而OWL则具有更好的表示能力。
RDF Schema概述
W3C推荐的资源描述框架部分
用于表示模式/术语化知识
使用RDF提前预定义语义的词汇
每个RDFS文档也是RDF文档
Namespace: http://www.w3.org/2000/01/rdf-schema# - 缩写为rdfs:
词汇是通用的,没有绑定特定应用领域
–允许部分指定用户自定义词汇的语义
– 因此,RDF软件可以正确地解释每个RDF Schema中定义的词汇。
2. 类和类层次结构
类和实例
类代表事物的集合
一个URI 可以属于多个类
类可以按层次结构进行组织:
预定义类
每个URI表示一个类,属于rdfs:Class的一个成员
因此rdfs:Class也是rdfs:Class的成员
rdfs:subClassOf是传递的(transitive)
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-0XdZU4gs-1637587710527)(C:\Users\Joseph\AppData\Roaming\Typora\typora-user-images\image-20211121144014246.png)]
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-D5Q6rltS-1637587710527)(C:\Users\Joseph\AppData\Roaming\T