数据组织——复习

大题

数据库三级模式两级映像

数据库领域公认的标准结构是三级模式结构,用户级对应外模式,概念级对应概念模式,物理级对应内模式,使不同级别的用户对数据库形成不同的视图。数据库的三级模式结构如图:

在这里插入图片描述
(1)外模式:外模式又称子模式或用户模式,对应于用户级。用户可以通过外模式描述语言来描述、定义对应于用户的数据记录,也可以利用DML对这些数据记录进行操作。
(2)概念模式:概念模式又称模式或逻辑模式,对应于概念级。它是全局逻辑结构,是所有用户的全局视图。它是由DDL来描述、定义的。
(3)内模式:内模式又称存储模式,对应于物理级。它描述了数据在存储介质上的存储方式和物理结构,对应着实际存储在外存储介质上的数据库。

什么是元数据

元数据(Metadata),又称中介数据,为描述数据的数据。元数据是指从信息资源中抽取出来的用于说明其特征、内容的结构化的数据(如题名,版本、出版数据、相关说明,包括检索点等),用于组织、描述、检索、保存、管理信息和知识资源。简单来说,元数据是关于数据的数据,即用来描述数据的信息。

在这里插入图片描述
这段话里提供了这样几个信息:年龄(三十岁上下)、身高(个子高挑)、相貌(身材匀称,黑黑的眉毛,红红的脸蛋)、性格(活跃,吵吵嚷嚷,不停地哼着小俄罗斯的抒情歌曲,高声大笑)。有了这些信息,我们就可以大致想像出瓦莲卡是个什么样的人。推而广之,只要提供这几类的信息,我们也可以推测出其他人的样子。这个例子中的"年龄”、“身高”、“相貌”、“性格”,就是元数据,因为它们是用来描述具体数据/信息的数据/信息。

在网页上用元数据进行数据组织:
元数据就是描述数据的数据,HTML有一个“官方的”方式来为一个文档添加元数据——元素,许多元素包含了name和content特性:name指定了meta元素的类型,说明该元素包含了什么类型的信息。contect制定了实际的元数据内容。例如:
<meta name = ”auther” content = “Chris Mills”>
Author这个元数据描述的内容是chris mills

语义网络

例子:油田企业有各种类型的设备,例如采油设备,采油设备包括游梁式抽油机和直线式抽油机;其中游梁式抽油机又包括常规型抽油机和异型游梁式抽油机。其中常规型抽油机又由悬绳器、驴头、游梁、连杆、减速箱、电动机和平衡块与曲柄组成。采油设备有型号、生产厂家、生产日期等。通常情况下,采油设备划归采油厂拥有。请根据上面所描述的信息,请采用语义网络来对这些设备知识进行组织。
(1)语义网络是节点和边形成的图形结构,用来表达概念之间的语义关系。其节点表示概念,而边则表示这些概念间的语义关系,从而形成一个由节点和弧组成的语义网络结构。
(2)采油设备的各部分、之类的属性、包含关系如下图:
在这里插入图片描述

什么是RDF

(1)RDF(资源描述框架)定义了一种用于描述资源和资源之间关系的模型。RDF 通过三元组(主体、谓词、宾语)表示信息。在知识图谱中,我们用 RDF 形式化地表示这种三元关系。所以我们可以称每一个知识图谱都为一个 RDF 数据集。
(2)油藏为例
在这里插入图片描述
(3) 罗纳尔多为例
在这里插入图片描述

XML schema

用XML schema与XML来定义并组织某个油田中两口油井生产日报数据,实现对需要这些数据的用户实现数据交换共享。

井号生产日期 (年/月/日)日产液量(吨/日)日产油量(吨/日)日采气量(方/日)备注
SRT-10012020/5/301103010此井刚刚做完压裂

1、要求选利用XML定义出模式层,即XML Schema。
2、依据1定义的模式层,利用XML实例化出上表中的数据。
XML是可扩展的标识语言,XML Schema是基于XML编写的且可以描述数据类型的一种升级版XML组织数据格式,可以更好地描述XML文档结构。

<?xml version="1.0" encoding="GB2312"?>
<xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema"
    targetNamespace="http://www.example.org/test"
    xmlns:tns="http://www.example.org/test" elementFormDefault="qualified">
<xs:element name = “油井生产日报数据”>
	<xs:complexType>
<xs:sequence>
	<xs:element name="井号" type="xs:string"/>
<xs:element name="生产日期" type="xs:date"/>
<xs:element name="日产液量" type="xs:int"/>
         <xs:element name="日产油量" type="xs:int"/>
         <xs:element name="日采气量" type="xs:float"/>
         <xs:element name="备注" type="xs:string"/>
<-xs:sequence>
	<-xs:complexType>
<-xs:element>
 <-xs:schema>
将其第一组实例化:
<?xml version="1.0" encoding="GB2312"?>
<油井生产日报数据 xmlns="http://www.w3school.com.cn"
      xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
      xsi:schemaLocation="http://www.w3school.com.cn test3.xsd">
    <井号>SRT-1001<井号>
     <生产日期>2020/5/30<生产日期>
    <日产液量>110<日产液量>
    <日产油量>30<日产油量>
    <日采气量>10<日采气量>
    <备注>此井刚刚做完压裂<备注>
</油井生产日报数据>

传播中,文本数据是如何组织

传播系统包含几个基本要素,如信源、信宿、信息、符号、信道和反馈。
信息是事物运动状态及规律的表征,可以是语言描述、文字描写等。信息是抽象的,当它被某种符号表征出来才是具体的。符号直接影响着传播的效果。符号分为语言符号和非语言符号,语言符号分为自然语言和人工语言,自然语言又分为口头语言和书面语言,这里所指的文本数据属于语言符号范畴内。

具体流程为:
信源利用编码器将文本数据编码成信号,传送到信道中,而信宿在信道中接收到信号,并将信号通过译码形成信息。
在这里插入图片描述

语义符号三角形

绘制语义符号三角形,并阐述数据、符号以及语义三者的关系,并说明它们在知识组织中作用。
在这里插入图片描述
(1)
指称物:数据是指现实世界中的实际对象。
符号:符号是一种表示数据的具体形式,通常是语言中的词语、图像等。
概念:语义是指符号所传递的意义或信息。
这三个要素之间的关系:符号和概念之间是直接联系的,概念通过符号表达出来;
概念是在客观事物即数据(指称物)的基础上概括而成的。
(2)
在知识组织中:
数据是知识组织的基础。通过对数据进行分类、整理和归纳,可以构建知识的结构和组织。
符号是知识组织和表示的媒介。符号通过语言、图形、符号系统等形式将数据进行抽象和表达。
语义是知识组织和传递的关键。语义涉及对符号所传递的数据进行理解和解释,使得不同用户能够共享相同的理解和意义。

传播学

交流传播的目的传播思想(通过自然语言的思想)传播的是符号不是意义,传播知识思想最终是为了行动,系统论的角度:接受了别人服务(学生是个系统,老师也是个系统,通过老师提供知识系统的功能,来改变学生系统的功能的参数,使学生状态发生改变)

传播学要素(传者、受者、信息、传播的通道(媒介)、反馈)
传播的内容如何用知识进行表示的(用自然语言怎么进行表示的)
传播的功能:监视环境、应付环境、传递遗产

语义web协议栈

在这里插入图片描述

第一层:Unicode和URI。 Unicode是一个字符集,负责处理资源的编码。URI即统一资源定位符,负责资源的标识。(是整个语义Web的基础)
第二层:XML+xml schema。XML提供了一种通用的标记语言,用于描述结构化数据。XML Schema 是一种用于定义 XML 文档结构和约束的语言。(语法层,表示数据的内容和结构)
第三层:RDF+rdf schema。RDF 通过三元组表示信息,并使用统一资源标识符(URI)来标识资源。(数据层,用于描述Web上的资源及其类型)
第四层:是本体层,用于描述各种资源之间的联系。本体层提供一个能明确地形式化地定义术语含义及术语间关系的语言,以准确定义术语语义及术语间的关系。

什么是本体

本体(Ontology)是概念和关系的形式化描述。
本体通常使用专门的语言(如OWL,RDF等)来定义概念、属性和关系之间的语义。
本体的基本元素包括类(Class)、函数、公理、实例(Instance)和关系(Relationship),通过定义这些元素及其之间的关系,可以构建一个形式化的知识表示模型。本体在语义网、知识图谱等领域具有广泛应用。

符号学理论与知识组织的关系

符号学理论研究符号的生成,意义、传播等,知识组织关注如何有效的表达知识,使其容易理解。
在知识组织中,符号学理论提供了重要的理论基础和方法。帮助我们理解符号在知识表示和传播中的作用。
符号学理论中的重要概念,符号系统、符号规则和语义,可以应用于知识组织实践中。

形式逻辑与知识组织的关系

形式逻辑是一种研究逻辑结构和推理规则的学科,它关注语言和符号系统中的推理过程和逻辑过程。知识组织则是将知识进行组织,分类呈现的过程。
形式逻辑提供了一套精确地符号系统和推理规则。用于研究和表示逻辑关系。能够帮助我们在知识组织的过程中更好地对知识之间的逻辑进行合理的推理,从而更好的对知识进行组织。让我们更加清晰的理解知识之间的逻辑,利用合理的推理达到理解知识的目的,也就是知识组织的目的。

关系模型是如何实现知识组织的

通过关系数据模型,可以实现知识组织的过程:
定义关系模式:根据知识的特点和需求,设计关系模式来表示不同知识元素的特征和内容。
建立关系表格:根据关系模式,创建关系表格,每个表格代表一个关系,每个属性对应一个列,每个记录对应一个知识元素
插入知识数据:将知识数据插入到表格中,通过填写属性值来表示知识的特征和内容
通过关系数据模型的组织和管理,知识可以以结构化的方式存储和操作,提供灵活、高效的知识访问和查询功能。关系数据模型的理论基础和操作方法为知识组织提供了坚实的基础。

系统论与知识组织的关系

系统论是研究系统的学科,关注系统整体和部分之间的联系和作用。知识组织是知识按照一定的规则来进行组织。
系统论提供了一种框架和方法论,用于研究和理解复杂的系统,他强调了整体和部分的依赖与关联以及系统各个部分之间的相互作用。在知识组织中,利用系统论能够帮助我们更好的理解知识之间的依赖和相互作用从而达到更好的理解知识的目的,同时也能帮助我们更好的对知识进行组织。
知识组织则是应用系统论的原理和方法,将知识进行组织和分类,知识组织可以包括分类、索引、标注等活动。

三个世界两级映射理论模型原理,设计出KO模型

1、总结并阐述三个世界理论模型两级映射理论、概念逻辑理论、系统理论?

现实世界是客观世界,是具体的、真实的。概念世界,就是抽象的、虚拟的世界。是现实世界在人们头脑中的反映,是对客观事物及其联系的一种抽象描述。研究对象是“概念”,概念由若干属性的属性值所组成,属性是事物某一方面特征的反映。计算机世界的信息经过加工、编码,以数据形式存入计算机中。

从现实世界收集数据,一级映射抽象为概念世界的概念模型,二级映射进行设计与实现,在计算机世界中实现服务于人类的功能,计算机世界服务于现实世界,再完善演化成逻辑学,泛化成语言学、符号学、逻辑语义学,从而形成概念系统,最终转换成计算机系统,再通过循环反复,服务于现实世界。
在这里插入图片描述
概念系统是由概念和它们之间的关系组成。概念是由内涵和外延组成,内涵对属性刻画,外延是数据来刻画。最后将概念世界的指称、符号转换成计算机世界中元数据语言描述。概念世界中的概念映射为计算机世界中的类,对象类概念映射为类,属性类概念映射为计算机中的属性。
2、利用1中总结的理论与方法,并结合你所熟悉的领域从现实世界出发直到计算世界一步一步设计出你所熟悉领域的知识组织模型(提醒:计算机世界的知识模型采用RDF或本体来表示)
以列车售票为例子:
现实世界中事物包括:乘客、售票处、列车。
概念系统由乘客、售票员、列车三个概念以及它们之间的关系组成。在概念世界中数据类属性:乘客有身份证号、姓名、电话号;售票处有地点;列车有列车号、目的城市、发车时间、抵达时间、票价。对象类属性:乘客和售票处事买票的关系;售票处和列车是管理的关系;乘客和列车是乘坐的关系。
在计算机世界中包含了passenger(乘客)类、ticket(售票处)类、train(列车)类:
passenger(乘客)类属性:ID、name、phone
ticket(售票处)类属性:place
train(列车)类属性:num、city、takeoffTime、recelveTime、price
在这里插入图片描述
RDF序列化N-Triples
在这里插入图片描述

基础知识与思维方法

1、你认为课上讲的对你有用的思维方法有哪些,请总结出来?并阐述如何利用这些方法来解决你学习或科学研究中的问题?
(1)溯源思维方法
在想问题的或者求知识时一定要挖掘本源,逐层找到源头,知道从哪里来,要有较真求实的态度才能对知识更好地理解与掌握。
(2)建构思维方法
一种快速梳理知识体系的方法,利用思维导图层次分明,条理清晰地将复杂问题简化的一种高效的方法。
(3)标准化思维方法
数据一定要按照一定的标准进行组织,标准是一套制度或规则,每本图书就属于一个独立的对象
(4)系统思维方法
系统论的核心思想,系统论的核心思想是系统的是整体观念,任何系统都是一个有机的整体,系统中的各要素不是孤立的存在,每个要素在系统中起着特定的作用,要素与要素之间关联,构成了一个整体。
(5)解构思维方法
将一件事物或者概念进行分解从而更接近本质的方法
(6)逻辑思维
通过分析、推理和归纳等方法,从已知事实中得出结论的过程
(7)还原思维
把事物返回到其所在的整体系统与初始状态中进行考察,以获得对事物的真实把握。还原思维的核心就是分解,强调系统可以还原成一个个元素,分别进行处理。与结构思维类似。

小题

小知识点

1、重要的还是:概念、属性、关系。(关系也称之为属性)
2、知识组织:形式:符号。内容:意义
3、概念:通过揭示事物的本质属性而反应事物的思维形式。(本质属性:性质属性、关系属性。)
概念:是由多个特性的唯一组合而创建的知识单元。
概念两个部分
内涵:组成一个概念的所有特性的总和
外延:一个概念涉及的所有对象的集合
4、系统论的核心问题:系统是由要素构成的,要素间有联系。(系统由要素、联系组成)
5、什么是数据:指对客观事件进行记录并可以鉴别的符号,是对客观事物的性质状态以及相互关系等进行记载的物理符号或这些物理符号的组合,它是可识别的、抽象的符号。
6、知识分类:陈述性知识、程序性知识
7、数据组织的定义:是按照一定的方式和规则对数据进行归并、存储、处理的过程
数据组织的类型:外表数据组织、内容数据组织
8、数据的生命周期:数据描述、数据获取、数据管理、数据应用
9、联系的本质:系统之间的功能调用
10、活动:事物与事物之间相互作用
11、联系有逻辑,故系统有规律、有序
12、数据模型3要素:数据结构、数据约束、数据操作
13、信息的特征:处理性、可共享性、确定性
14、数据组织技术:层次模型、网状模型、关系模型、面向对象模型
15、层次模型组织原则:采用层次数据结构来组织数据
16、数据仓库的概念模型:星形模型、雪花模型、事实星座模型
17、知识过程三大技术:知识获取、知识表示、知识处理
18、数据的定义:对事实、概念或指令的一种形式化的表示,适用于以人工或自动方式进行通信、解释或处理。老师讲的:是指描述事物的符号的记录
19、分类法定义:通过比较事物之间的相似性,把具有某些共同点或相似特征的事物归属于一个不确定集合的逻辑方法。
20、KOS=概念+联系的求和
21、知识->信息->数据->符号
22、知识的本质:描绘世界上各种事物运作的原理。
23、信息、物质、能量:三大支柱。
(信息是物质的一种普遍属性)
24、元数据作用:间接为数据赋予语义

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

庸人阿九

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值