数据(Date):
数据是数据库中存储的基本对象,描述事物的符号记录称为数据。数据的含义称为数据的语义,数据与其语义是不可分的
数据库:DB(Database):
是长期储存在计算机内、有组织的、可共享的大量数据的集合
数据库管理系统:DBMS
DBMS是一个大型复杂的基础软件系统,位于用户与操作系统之间的一层数据管理软件。DBMS能够科学地组织和存储数据、高效地获取和维护数据。
DBMS具有数据定义(提供数据库定义语言DDL),数据组织、存储和管理(提供数据操作语言DML),数据库的事务管理和运行管理(安全性等),数据库的建立和维护等功能。
数据库系统(DMS):
数据库系统由数据库、数据库管理系统(及其应用开发工具)、应用程序、数据库管理员四部分构成。
1、结构化查询语句:SQL
DBMS--执行-->SQL--操作-->DB
数据库最基本单元是表:table
行(row):数据/记录 列(column):字段(字段名、数据类型、约束)
命名规范:所有标识符全部小写,下划线分割
分号表示结束,不见分号不执行
数据库字符串统一用单引号
端口号3306
xxx.sql:SQL脚本文件(source执行)
“型” 和“值” 的概念
型(Type)
对某一类数据的结构和属性的说明 值(Value)
是型的一个具体赋值
三级模式、二级映像:
应用-->外模式-->模式-->内模式-->数据库
外模式/模式映像 内模式/模式映像
模式(也称逻辑模式)
数据库中全体数据的逻辑结构和特征的描述
所有用户的公共数据视图
一个数据库只有一个模式
模式的地位:是数据库系统模式结构的中间层
与数据的物理存储细节和硬件环境无关
与具体的应用程序、开发工具及高级程序设计语言无关
外模式(也称子模式或用户模式)
数据库用户(包括应用程序员和最终用户)使用的局部数据的逻辑结构和特征的描述
数据库用户的数据视图,是与某一应用有关的数据的逻辑表示
外模式的地位:介于模式与应用之间
模式与外模式的关系:一对多
外模式通常是模式的子集
一个数据库可以有多个外模式。反映了不同的用户的应用需求、看待数据的方式、对数据保密的要求
对模式中同一数据,在外模式中的结构、类型、长度、保密级别等都可以不同
外模式与应用的关系:一对多
同一外模式也可以为某一用户的多个应用系统所使用
但一个应用程序只能使用一个外模式
内模式(也称存储模式)
是数据物理结构和存储方式的描述
是数据在数据库内部的表示方式
记录的存储方式(例如,顺序存储,按照B树结构存储,按hash方法存储等)
索引的组织方式
数据是否压缩存储
数据是否加密
数据存储记录结构的规定
一个数据库只有一个内模式
两类模型:概念模型 逻辑模型和物理模型
概念模型: 也称信息模型,它是按用户的观点来对数据和信息建模,用于数据库设计
逻辑模型和物理模型 :
逻辑模型主要包括网状模型、层次模型、关系模型、面向对象数据模型、对象关系数据模型、半结构化数据模型等。按计算机系统的观点对数据建模,用于DBMS实现。
物理模型是对数据最底层的抽象,描述数据在系统内部的表示方式和存取方法,在磁盘或磁带上的存储方式和存取方法。
概念模型的一种表示方法:实体E-联系R方法(表示实体属性关系)
(1)实体(Entity)
客观存在并可相互区别的事物称为实体。 可以是具体的人、事、物或抽象的概念。(2)属性(Attribute)
实体所具有的某一特性称为属性。 一个实体可以由若干个属性来刻画。(3)码(Key)
唯一标识实体的属性集称为码。
(4)实体型(Entity Type)
用实体名及其属性名集合来抽象和刻画同类实体称为实体型(5)实体集(Entity Set)
同一类型实体的集合称为实体集实体联系方法:E-R:一对一(n:n),一对多(n:m),多对多(m:m) 线 树 图
实体:矩形
联系:菱形 属性:椭圆 工具:mysql workbench
常用的数据模型
层次模型(Hierarchical Model):
用树形结构来表示各类实体以及实体间的联系
网状模型(Network Model):
网状模型中子女结点与双亲结点的联系可以不唯一要为每个联系命名,并指出与该联系有关的双亲记录和子女记录
关系模型(Relational Model)):
关系模型中数据的逻辑结构是一张二维表,它由行和列组成
面向对象数据模型(Object Oriented Data Model)
对象关系数据模型(Object Relational Data Model)
半结构化数据模型(Semistruture Data Model)
关系模型的数据结构
关系术语 | 一般表格术语 |
---|---|
关系名 | 表名 |
关系模式 | 表头 |
关系 | 二维表 |
元组 | 记录或行 |
属性 | 列 |
属性名 | 列名 |
属性值 | 列值 |
分量 | 一条记录(元组)中的一个列值(属性值) |
非规范关系 | 表中有表 |
关系的完整性约束条件
实体完整性
参照完整性
用户定义的完整性
2、关系运算
域是一组具有相同数据类型的值的集合
关系
D1×D2×…×Dn的子集叫作在域D1,D2,…,Dn上的关系,表示为
R(D1,D2,…,Dn)
R:关系名
n:关系的目或度(Degree)
元组
关系中的每个元素是关系中的元组,通常用t表示。
单元关系与二元关系
当n=1时,称该关系为单元关系(Unary relation)或一元关系
当n=2时,称该关系为二元关系(Binary relation)
关系的表示
关系也是一个二维表,表的每行对应一个元组,表的每列对应一个域
属性
关系中不同列可以对应相同的域
为了加以区分,必须对每列起一个名字,称为属性(Attribute)
n目关系必有n个属性
码
候选码(Candidate key)
若关系中的某一属性组的值能唯一地标识一个元组,则称该属性组为候选码
简单的情况:候选码只包含一个属性
全码(All-key)
最极端的情况:关系模式的所有属性组是这个关系模式的候选码,称为全码(All-key)
主码
若一个关系有多个候选码,则选定其中一个为主码(Primary key)
主属性
候选码的诸属性称为主属性(Prime attribute)
不包含在任何侯选码中的属性称为非主属性(Non-Prime attribute)或非码属性(Non-key attribute)
三类关系
基本关系(基本表或基表)
实际存在的表,是实际存储数据的逻辑表示
查询表
查询结果对应的表
视图表
由基本表或其他视图表导出的表,是虚表,不对应实际存储的数据
基本关系的性质
① 列是同质的(Homogeneous)
② 不同的列可出自同一个域
其中的每一列称为一个属性 不同的属性要给予不同的属性名③ 列的顺序无所谓,,列的次序可以任意交换
④ 任意两个元组的候选码不能相同
⑤ 行的顺序无所谓,行的次序可以任意交换
⑥ 分量必须取原子值
这是规范条件中最基本的一条
关系模式(Relation Schema)是型,关系是值,关系模式是对关系的描述
元组集合的结构
属性构成
属性来自的域
属性与域之间的映象关系
关系模式可以形式化地表示为:
R(U,D,DOM,F)
R 关系名
U 组成该关系的属性名集合 D U中属性所来自的域 DOM 属性向域的映象集合 F 属性间数据的依赖关系的集合
关系模式通常可以简记为
R (U) 或 R (A1,A2,…,An)
R: 关系名
A1,A2,…,An : 属性名
注:域名及属性向域的映象常常直接说明为属性的类型、长度
关系完整性
实体完整性和参照完整性
关系模型必须满足的完整性约束条件称为关系的两个不变性,应该由关系系统自动支持
用户定义的完整性
应用领域需要遵循的约束条件,体现了具体领域中的语义约束
实体完整性规则(Entity Integrity)
若属性A是基本关系R的主属性,则属性A不能取空值
(1)实体完整性规则是针对基本关系而言的。
一个基本表通常对应现实世界的一个实体集。
(2)现实世界中的实体是可区分的,即它们具有某种唯 一性标识。
(3)关系模型中以主码作为唯一性标识。
(4)主码中的属性即主属性不能取空值。
参照完整性
设F(课程号、学号)是基本关系R(选修表)的一个或一组属性,但不是关系R的码。如果F(课程号、学号)与基本关系S(课程表、学生表)的主码Ks相对应,则称F(课程号、学号)是R(选修表)的外码
基本关系R称为参照关系 (选修表)(Referencing Relation)
基本关系S称为被参照关系(学生表、课程表)(Referenced Relation)或目标关系(Target Relation)
参照完整性规则
若属性(或属性组)F是基本关系R的外码它与基本关系S的主码Ks相对应(基本关系R和S不一定是不同的关系)则对于R中每个元组在F上的值必须为:
关系运算:
并(U):合并
差(-):差异
交(n):相同
笛卡尔积(x):乘积
选择(where):查找
投影(selcet):找出
连接(join):
θ连接:有条件的笛卡尔积
等值连接:θ为等于号
自然连接:特殊的等值连接,比较分量为相同的属性集并去除重复(没有重复属性就为笛卡尔积)
除:除去包含
专门的关系运算符
σ 选择
π 投影
⋈ 连接
÷ 除
3、数据类型:
数据类型 | 长度 | 注释 |
---|---|---|
varchar | 最长255 | 动态分配空间字符串(可变长度,比较智能,节省长度) |
char | 定长字符串(速度快) | |
int | 最长11 | 整数型, |
tintint | 1Byte | 小整数值 |
smallint | 2Byte | 大整数值 |
mediumint | 3Byte | 大整数值 |
unsigned | 无符号(写后面) | |
decimal(m,n) | 高精度浮点型,最大65,默认10 m为总长不含点,n为小数最大30,默认0 | |
bigint | 长整型 | |
float | 单精度浮点型 | |
double | 双精度浮点型 | |
date | 默认格式:’%Y-%m-%d’ | 短日期型(年月日); |
current | 当前时间 | |
time | HH:MM:SS | |
year | YYYY | |
datetime | 长日期型(年月日时分秒);默认格式:'%Y-%m-%d %h:%i:%s' | |
now() | 当前时间 | |
timestamp | 混合日期类型 | |
clob | 超过255使用 | 字符大对象(最多4g) |
blob | 使用IO流 | 二进制大对象(存储图片,声音,视频等流媒体数据) |
text | 长文本数据 | |
langtext | 极大文本数据 | |
enum(‘值1’,‘值二’) | 数据固定取一 | 枚举:枚举选择量:65535 |
set(‘值1’,‘值二’) | 数据固定取多 | 集合:元素数量:64 |
算数运算符
算数运算符 | |
---|---|
= | 等于 |
!= | <> | 不等于 |
<=> | 安全等于,两段有null时使用,都为null=true,一个为null=false //字符串和数值比较存在隐式转换数值,不成功赋值0 |
逻辑运算符
逻辑运算符</ |
---|