众所周知,关系数据库在数据库市场占据着很大的份额。关系数据库具有坚实的理论基础----关系模型和关系代数。
下面简单总结一下关系模型和关系代数内容,作为后续认识和学习关系数据库的基础。
关系数据库处理的是结构化数据,说的明确一点就是处理具有固定格式的数据,表就是其代表,所以关系数据库就是表的集合(集合论)
1.基本结构
属性:表中的一列
域:表中某一属性值的取值范围
关系:一系列域上的笛卡尔积的子集(表)
元组:表的一行
元组变量:代表元组的变量
数据库模式:数据库的设计逻辑
关系模式:正常就是数据库的表的定义---DDL(如mysql里的系统表information.schema,performance.schema)
数据库实例:给定时刻数据库数据的一个快照(多表多库)
关系实例:具体模式的值,即当时表的值。
主码:在同一个关系中区分元组的候选码
超码:一个或者多个属性的集合,这些属性的组合可以使其在关系中唯一的标识一个元组。
候选码:超码的小值。
这里具体到数据库里就是数据库的key,primary key等。
码的指定代表了被建模的事物在现实世界中的约束。
外码:一个关系模式可能在其属性中包含着另外一个关系模式的主码(外键,参照完整性,参照关系)
模式图:对于设计具体模式以及模式间的关系使用。
查询语言:用户用来从数据库中获取信息的语言。分为过程化和非过程化
过程化:操作必有结果(实际应用)
非过程化:操作只需描述需要信息,但不用给出获取该信息的具体过程(理论推演)
在真实中经常是二者结合比如说我们延迟物化,就是先尽量非过程化,最后再过程化,因为过程化涉及到数据的获取,比较消耗资源。
2.关系代数基本运算
选择(select):选出满足指定谓词的元组。(一元运算)
投影(project):返回作为参数的关系的某些属性(去重)(一元运算)
集合运算----由前面的知识知道,关系数据库就是一类集合,所以集合论的知识使用适用它
并、差
笛卡尔积
更名(一元运算)
交
除
赋值(不能增加关系代数的表达能力,但是可以使复杂的查询的表达变得简单)
自然连接(natural join):基于两个关系模式中都出现的属性上的相等性进行选择,最后去重--简单说就是两个关系中有相等的属性是纽带,把这些相等的属性的元组合并起来再去重就行,语义很朴素。
3.扩展关系代数运算
广义投影:投影加上聚集运算
聚集函数:
sum,min,max,avg,count等
外连接:
左外连接:以左边关系为基础,来用右侧关系的元组匹配,不匹配的添加null
右外连接:以右边关系为基础。。。。
全外连接:左右关系的所有组合,没有的填null
空值处理----空值是一个不确定的,只要和空值进行计算就为空,空值和空值逻辑上认为是一样。
数据库的修改
删除,插入,更新(真实的数据库单条操作批量操作等)