理解数据库

本文详细解释了信息与数据的区别,介绍了数据处理过程,重点讲解了数据库中的术语、E-R模型、结构模型(如层次和网状模型)、以及关系数据模型,包括二维表、关系元素(如主键、外键)和其性质(如同质性、不可重复性等)。
摘要由CSDN通过智能技术生成

一、了解什么是信息

1.1 信息和数据

1.1.1 信息 (information)

信息,指音讯、消息、通讯系统传输和处理的对象,泛指人类社会传播的一切内容。

1948年,数学家香农在题为“通讯的数学理论”的论文中指出:“信息是用来消除随机不定性的东西”。创建一切宇宙万物的最基本单位是信息。

1.1.2 数据 (Data)

用来描述客观事物的具体表现形式

数据不仅包括数字、文字形式,而且还包括图形、图像、声音、动画等多媒体数据
在这里插入图片描述

1.2 数据处理

数据处理(data processing)是对数据的采集、存储、检索、加工、变换和传输。

数据处理的基本目的是从大量的、可能是杂乱无章的、难以理解的数据中抽取并推导出对于某些特定的人们来说是有价值、有意义的数据。

  1. 数据管理:这个方面的主要任务是收集信息并将其用数据的形式表示。这包括收集原始数据、整理数据的格式和结构以及将数据按照类别进行组织和保存。数据管理还包括对数据的存储和维护,确保数据的安全性和可访问性。

  2. 数据加工:这个方面的主要任务是对数据进行变换、抽取和运算。数据加工可以通过各种技术和工具来实现,例如数据清洗、数据转换和数据集成。这些操作可以帮助提取数据中的有用信息,去除噪声和冗余数据,以及进行数据计算和分析。

  3. 数据传播:这个方面的主要任务是将处理后的数据以各种形式传递给用户或其他系统。数据传播可以通过多种方式进行,例如生成报告、可视化数据、提供接口供其他系统使用等。数据传播可以帮助用户理解数据的含义,并支持决策和行动。

二、如何描述数据具备的信息

在现实世界可以根据实体的物记录;在计算机的世界中由01决定,是对现实的一种模拟抽象。

2.1 数据库的一些术语:

  1. 实体(Entity):实体是客观存在且可以相互区别的事物。它可以是具体的物体或抽象的概念。

  2. 属性(Attribute):属性描述了实体的特征或性质。一个实体可以由多个属性来描述,每个属性都提供了关于实体的一些信息。

  3. 码(Key):码是用来唯一标识实体的属性或属性的组合。它可以用来唯一地识别一个实体,确保实体在数据中的唯一性

  4. 域(Domain):域是属性的取值范围。它定义了属性可以取的值的范围,限制了属性的取值范围,确保数据的有效性和一致性

  5. 实体型(Entity Type):实体型是具有相同属性的实体的抽象和刻画。它由实体名和属性名的集合组成,用来描述同类实体的共同特征和性质。例如,学生(学号,姓名,性别,出生日期,系)就是一个实体型,它描述了所有学生共同具有的属性。

  6. 实体集(Entity Set):实体集是同类实体的集合。它包含了所有属于同一实体型的实体。例如,全体学生、一批图书等都可以是实体集,它们都是具有相同属性的实体的集合。实体集可以用来表示一组相关的实体。

  7. 联系(Relationship):

-(1)一对一关系(One-to-One Relationship):一个实体集的实体与另一个实体集的实体之间存在唯一的对应关系。例如,一个人只能有一个身份证号,一个身份证号也只能对应一个人。
-(2) 一对多关系(One-to-Many Relationship):一个实体集的实体可以与另一个实体集的多个实体相关联,而另一个实体集的实体只能与一个实体集的实体相关联。例如,一个班级可以有多个学生,但一个学生只能属于一个班级。
-(3) 多对多关系(Many-to-Many Relationship):一个实体集的实体可以与另一个实体集的多个实体相关联,而另一个实体集的实体也可以与多个实体集的实体相关联。例如,一个学生可以选择多门课程,而一门课程也可以有多个学生选择。

三、数据模型

数据模型是用来描述数据、数据之间的关系以及数据的约束的概念工具。
它提供了一种抽象的方式来组织和表示数据,以便在计算机系统中进行处理和管理。

3.1 概念模型 E-R,是对信息世界的建模

3.2 结构模型

	层次模型:用“树”结构来表示数据之间的关系
  1. 层次模型(Hierarchical Model):数据以树形结构组织,每个节点可以有多个子节点,但只能有一个父节点。这种模型适用于具有明确层次结构的数据,如文件系统。

     网状模型:用“图”结构来表示数据之间的关系
    
  2. 网状模型(Network Model):数据以图形结构组织,允许一个节点有多个父节点和多个子节点。这种模型适用于复杂的关系型数据,如图数据库。

     关系模型:用“表”结构(或称关系)来表示数据之间的关系。
    
  3. 关系模型(Relational Model):数据以表格的形式组织,通过行和列来表示实体和属性,使用关系代数进行查询和操作。这种模型是最常用的数据模型,如关系型数据库。

3.2.1 结构数据模型的三要素包括:

  1. 数据结构:用于描述系统的静态特征,包括数据本身和数据之间的联系。

  2. 数据操作:对数据库中各种对象的实例允许执行的操作集合,包括检索和更新。

  3. 数据约束条件:一组完整性规则的集合,用于限定数据模型中数据及其联系的状态和变化,以保证数据的正确性和有效性。

四、关系数据模型

4.1 由一张二维表组成及其关系

在这里插入图片描述

  1. 关系(Relation):关系是关系模型中最基本的数据结构,它由一组具有相同属性的元组(Tuple)组成。关系可以看作是一个二维表格,其中每一列代表一个属性,每一行代表一个元组。

  2. 属性(Attribute):属性是关系模型中的列,用于描述关系中的特征或性质。每个属性都有一个名称和一个数据类型,例如,姓名、年龄、地址等都可以是关系的属性。

  3. 元组(Tuple):元组是关系模型中的行,它代表了关系中的一个实例或记录。每个元组由一组属性值组成,每个属性值对应一个属性。

  4. 主键(Primary Key):主键是关系中的一个或多个属性,用于唯一标识关系中的每个元组。主键的值在关系中必须是唯一且非空的,它可以用来识别和访问关系中的特定元组。

  5. 外键(Foreign Key):外键是关系中的一个或多个属性,它与其他关系的主键形成关联。外键用于建立关系之间的联系,它可以用来实现关系之间的引用和关联。

  6. 域(Domain):域是属性的取值范围,它定义了属性可以取的值的类型和范围。例如,一个属性的域可以是整数、字符串、日期等。域限制了属性的取值范围,确保数据的有效性和一致性。

  7. 分量(Component):分量是元组中的一个属性值,它是元组在某个属性上的取值。例如,在一个关系中,每个元组都有多个分量,每个分量对应一个属性的取值。

  8. 全键(Super Key):全键是能够唯一标识关系中每个元组的属性集合。全键可以由一个或多个属性组成,它的取值在整个关系中必须是唯一的。全键可以用来识别和访问关系中的特定元组。

  9. 主属性(Primary Attribute):主属性是全键中的属性,它是用来唯一标识关系中每个元组的属性。主属性的取值在整个关系中必须是唯一的,它可以用来识别和访问关系中的特定元组。

  10. 候选键(Candidate Key):候选键是能够唯一标识关系中每个元组的最小属性集合。候选键是全键的子集,它的取值在整个关系中必须是唯一的。一个关系可以有多个候选键,其中选择一个作为主键。

4.2性质

  1. 同质性(Homogeneity):同一属性的数据具有同质性,即每一列中的分量是同一类型的数据,它们来自同一个域。

  2. 不可重复性(Uniqueness):同一关系的属性名具有不可重复性,即同一关系中不同属性的数据可以来自同一个域,但不同的属性要有不同的属性名。

  3. 顺序无关性(Order Independence):关系中列的位置具有顺序无关性,即列的次序可以任意交换、重新组织。

  4. 元组无冗余性(Tuple Uniqueness):关系具有元组无冗余性,即关系中的任意两个元组不能完全相同。

  5. 元组顺序无关性(Tuple Order Independence):关系中元组的位置具有顺序无关性,即元组的顺序可以任意交换。

  6. 原子性(Atomicity):关系中每个分量必须取原子值,即每个分量都必须是不可分的数据项。

评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

你会魔法吗✧(≖ ◡ ≖✿)

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值