数据库系统概论(第5版)——阅读笔记(数据库原理)

本文是作者重读《数据库系统概论》的笔记,主要涵盖数据库原理,包括数据管理技术的三个阶段、数据模型、数据库系统的结构、数据库安全性和控制等内容。作者强调数据库在大数据和数据挖掘中的重要性,并指出数据库、数据挖掘算法和云计算是关键技术。笔记详细阐述了数据库的逻辑结构、数据独立性、关系模型、层次模型、网状模型以及数据库安全性的用户身份鉴别、存取控制、审计和数据加密等概念。
摘要由CSDN通过智能技术生成

前言

数据库是大数据领域非常重要的一个部分,并且随着数据量不断增大和数据结构更加复杂,数据库技术将变得日益重要。笔者本科时修过数据库原理的课程,但当时仅从应用的角度去看,甚至都不能算有角度,只能说学了一点sql语句,甚是浅显,说一无所知都不过分。目前笔者处在研究生阶段,研究方向为大数据与数据挖掘,经过学习和探索,笔者认为数据库是本领域最重要的三项技术之一,其他两项分别为数据挖掘算法和云计算技术,有机会也会进行探讨与分享。本系列内容将是我在重读王珊、萨师煊编著,高等教育出版社出版的《数据库系统概论(第5版)》的过程中的笔记和思考,笔者打算从数据库原理、关系数据库原理和数据库技术的应用三个方面进行梳理。目前来看,不知内容浅显还是深入,仅代表个人的学习感悟,如有错误,欢迎指正。

数据库原理

1.1 数据库概述

数据库是数据管理的有效技术,是计算机科学的重要分支。
1. 数据库的四个基本概念:数据、数据库、数据库管理系统和数据库系统。 数据是数据库中存储的几本对象。描述事物的符号记录称为数据。数据的含义称为数据的语义。数据库是存放数据的仓库。数据库是长期存储在计算机内、有组织的、可共享的大量数据的集合。数据库数据具有永久存储、有组织和可共享三个基本特点。数据库管理系统(DBMS)是位于用户与操作系统之间的一层数据管理软件。DBMS的主要功能有数据定义、数据组织存储管理、数据操纵、数据库的事务管理和运行管理、数据库的建立和维护、其他(通信、数据转换)等。数据库系统(DBS)是由数据库、数据库管理系统、应用程序和数据库管理员组成的存储、管理、处理和维护数据的系统。
2. 数据管理技术的三个阶段: 人工管理阶段——>文件系统阶段——(避免数据冗余,解决多用户、多应用共享数据问题)——>数据库系统阶段。
3. 数据库系统的特点: ①数据结构化。②数据的共享性高、冗余度低且易扩充。避免数据之间的不相同性和不一致性。(不一致性是指同一数据不同副本的值不一样)③数据独立性高。物理独立性是指用户的应用程序与数据库中数据的物理存储是相互独立的。逻辑独立性是指用户的应用程序与数据库的逻辑结构是相互独立的。④数据由数据库管理系统统一管理和控制。DBMS提供的数据控制功能包括数据的安全性保护数据的完整性检查并发控制数据库恢复
4. 数据模型: 数据模型是一种模型,它是对现实世界数据特征的抽象。两大类:第一类是概念模型,第二类是逻辑模型和物理模型。用户的观点—>计算机系统的观点。现实世界—>信息世界(第一类)—>机器世界(第二类)。组成要素:数据结构,数据操作,数据的完整性约束条件。数据结构描述数据库的组成对象以及对象之间的联系,是系统的静态特性。数据操作是指对数据库中对象实例允许执行的操作的集合,主要有查询和更新(增删改)两大类,是对系统动态特性的描述。数据的完整性约束条件是一组完整性规则,对数据及其联系的制约和依存规则,以保证数据的正确、有效和相容。
4.1 概念模型
(1)信息世界的概念:实体(人,事,物),属性,码(唯一标识实体的属性集,学号),实体型(实体名与属性名集合抽象表示的同类实体,如学生(学号,姓名,性别)),实体集(同一类实体的集合,如全体学生),联系(实体各属性间,实体与实体间,一对一,一对多,多对多)。
(2)表示方法:实体-联系方法。该方法用E-R图,E-R方法也称为E-R模型
4.2 逻辑模型
常见的有层次模型,网状模型,关系模型,面向对象数据模型,对象关系数据模型,半结构化数据模型。层次模型和网状模型统称为格式化模型,使用和实现时要涉及物理层的复杂结构,因而被关系模型取代,随着面向对象方法的影响,许多关系数据库厂商为了支持面向对象模型,将关系模型扩展为对象关系模型。由于Web上信息来源为半结构化和非结构化数据源,产生了以XML为代表的半结构化数据模型和非结构化数据模型。
格式化模型中实体用记录表示,实体的属性对应记录的数据项或字段,数据结构的单位是基本层次联系。基本层次联系指两个记录及他们之间的一对多(包括一对一)的联系。一-双亲节点,多-子女节点。
4.2.1 层次模型
层次数据库采用层次模型,代表有IMS(Information Management System),IBM,1968。
(1)数据结构: 数据库中满足两个条件的基本层次联系的集合为层次模型:1)有且只有一个节点没有双亲节点,即根节点;2)根节点以外的其他节点有且只有一个双亲节点。
节点表示记录类型,连线表示记录类型之间的联系。记录类型描述实体,包含若干个字段,字段描述实体的属性。同一记录类型中各字段不能同名,每个记录类型可以定义一个排序字段,称为码字段,唯一表示一个记录值。
(2)数据操纵与完整性约束: 插入时,无双亲节点值就不能插入它的子女节点值。删除时,删除双亲节点值相应的子女节点值也将被同时删除。
(3)优缺点: 优点——简单清晰,查询效率高,性能优于关系数据库,不低于网状数据库,提供良好的完整性支持。缺点——无法表示现实世界中非层次性的联系(多对),对插入删除操作的限制多,应用程序编写比较复杂,查询子女节点必须通过双亲节点,结构严密层次命令趋于程序化

  • 0
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值