数据库概念总结_sname和tname-CSDN博客

本文链接：https://blog.csdn.net/qq_28738419/article/details/53612794

  基本概念集合体： 

  关系(relation): 一个关系通常就是一张表 

  元组(tuple)：一行就是一个元组 

  属性(attribute)：一列就是一个属性 

  码(key):可以确定一个元组 

  分量：元组中一个属性值 

  域：一组具有相同类型的值得集合 

  数据库三级模式 

  笛卡尔积： 

  例子： D1={1,2} D2={1,2} 

  D1XD2={{1,1},{1,2},{2,1},{2,2}} 

  主码：PRIMARY KEY 

  主码从多个候选码中选出，候选码的属性称为 
 主属性，不包含任何候选码中的属性称为 
 非主属性 

  关系分为三种类型 基本关系（真实存在的表） 查询表（查找结果对应的表） 视图表(不存在的表，由其他视图或基本表导出) 

  关系运算 

  U（并） 如果有相同的列名，就找到相同的合并，不同的就增加一行存放 

  ^ （交） 找到相同的行形成一个表即可 

  -（差） 一个表里除去与减去的那个表相同的部分 

  X（笛卡尔） 一个表的每一行都与另一张表中的每一行形成一行。 

  选择 ： 
 σf（R）={t|t∈R∧ 
 F（t） 
 =‘真’}从关系R中选取使逻辑表达式F为真的元组，这是从行的角度进行的运算 

 
 【例1】查询年龄小于20岁的元组。 

 
 σSage<20（Student） 

 
 投影： 
 　　　∏A（R） = { t[A] | t∈R }关系R上的投影是从R中选择出若干属性列组成新的关系，投影操作是从列的角度进行的运算 

 
 【例2】查询学生关系Student在学生姓名和所在系两个属性上的投影。 

 
 　　 ∏Sname,Sdept（Student） 

 
 连接：笛卡尔积 保留左边表空值叫左外连接 保留右边表空值叫做右外连接 

 
 除运算： 象集 一列上某个值对应的多个其他列的值得集合  

 
 除运算的结果就是如果前一个表里某行有的分量（a1）的象集里有另一张表里有的列的投影的话，就取该分量为结果(p56) 

  数据库安全概念 

  主体：就是操作用户 

  客体：就是被操作的权限。 

  敏感标记： TS>S>C>P 

  审计：就是日志，把对数据库的操作生成日志。 

  数据库完整性（数据得正确性和相容性--数据在同一对象在不同表中的数据符合逻辑） 

  关系数据理论 

  数据依赖（一个关系内部属性与属性之间的一种约束关系）（这部分转载自 
  http://blog.sina.com.cn/s/blog_5cd78a5d0100djoj.html 稍微做了改动） 

  函数依赖 

  设R（U）是属性U上的一个关系模式，X和Y均为U={A1，A2，…，An}的子集，r为R的任一关系，如果对于r中的任意两个元 组u，v，只要有u[X]=v[X]，就有u[Y]=v[Y]，则称X函数决定Y，或称Y函数依赖于X，记为X→Y。 

  例： 

  (sno-学生ID，tno-教师ID，cno-课程ID，sname-学生姓名，tname-教师姓名，cname-课程名称，grade-成绩） 

  1、sno→sname, cno→cname,(sno,cno)→grade √ 

  2、sname→sno, tno→cno, sno→tname ×     

  依赖关系的说明 

  设X、Y均是U的子集 

  1、X和Y间联系是1:1，则X→Y,Y→X。（相互依赖，可记作X←→Y） 

  2、X和Y间联系是M:1(M)， 则X→Y。 

  3、X和Y间联系是M:N(M,N)，则X、Y间不存在函数依赖。 

  部分依赖说明 

  （学生ID，所修课程ID）→学生姓名 

  学生ID→学生姓名 

  学生姓名可以依赖于关键字的一个主属性——学生ID，因此学生姓名部分函数依赖于（学生ID，所修课程ID）。 

  完全依赖说明 

  （学生ID，所修课程ID）→成绩 

  成绩既不能单独依赖于学生ID，也不能单独依赖于所修课程ID，因此成绩完全函数依赖于关键字。 

  平凡依赖与非平凡依赖 

  若Y包含于X，则称X→Y为：平凡函数依赖； 

  若Y不包含于X，则称X→Y为：非平凡函数依赖。 

 
 多值依赖的定义：（本部分参考  
 http://www.2cto.com/database/201412/362708.html 
   
 ） 

 
 设R(U)是一个属性集合U上的一个关系模式，X, Y, 和Z是U的子集，并且Z=U-X-Y，多值依赖X->->Y成立当且仅当对R的任一个关系r，r在(X,Z)上的每个值对应一组Y的值，这组值仅仅决定于X值而与Z值无关。 

 
 例子： 

 
 （课程C） ——（教师T）—（参考书B） 

 
 数据库概率 —顾国生老师——数学分析 

 
 数据库概率 —顾国生老师——高等代数 

 
 数据库概率 —顾国生老师——微分方程 

 
 上述例子U{C,T,B},其中课程C和教师T唯一确定一组B，却与T无关，经由C决定，然而T并不是空集，所以是非平凡的多值依赖。 

 
 事实上，当T为空的时候，如果C中的每一个值c对应B中的一个确定的值，则变为函数依赖，所以函数依赖是多值依赖的一种特殊情况。 

码

  超码 

  元组部分依赖的称之为 超码 ，候选码是最小的超码 

  主属性与非主属性 

  包含在任何一个候选码中的属性称之为 主属性，不包含任何候选码中的属性称之为 非主属性； 

  范式（本部分参考 
  http://blog.sina.com.cn/s/blog_46d817650100yj2i.html ） 

 
 第一范式 1NF（特点 ： 属性不可分）下表中的 tel属性分成了两个 

name	tel		age
大宝	13612345678		22
小明	13988776655	010－1234567	21

 
 第二范式 2NF（特点：属性不可分且非主属性完全依赖于码） 

  一 个候选码中的主属性也可能是好几个。如果一个主属性，它不能单独做为一个候选码，那么它也不能确定任何一个非主属性。给一个反例：我们考虑一个小学的教务 管理系统，学生上课指定一个老师，一本教材，一个教室，一个时间，大家都上课去吧，没有问题。那么数据库怎么设计？（学生上课表） 

学生	课程	老师	老师职称	教材	教室	上课时间
小明	一年级语文（上）	大宝	副教授	《小学语文1》	101	14：30

  一个学生上一门课，一定在特定某个教室。所以有（学生，课程）－>教室 

  一个学生上一门课，一定是特定某个老师教。所以有（学生，课程）－>老师 

  一个学生上一门课，他老师的职称可以确定。所以有（学生，课程）－>老师职称 

  一个学生上一门课，一定是特定某个教材。所以有（学生，课程）－>教材 

  一个学生上一门课，一定在特定时间。所以有（学生，课程）－>上课时间 

  因此（学生，课程）是一个码。 

 
 然而，一个课程，一定指定了某个教材，一年级语文肯定用的是《小学语文1》，那么就有课程－>教材。（学生，课程）是个码，课程却决定了教材，这就叫做不完全依赖，或者说部分依赖。出现这样的情况，就不满足第二范式！ 

  有什么不好吗？你可以想想： 

  1、校长要新增加一门课程叫“微积分”，教材是《大学数学》，怎么办？学生还没选课，而学生又是主属性，主属性不能空，课程怎么记录呢，教材记到哪呢? ……郁闷了吧?(插入异常) 

  2、下学期没学生学一年级语文（上）了，学一年级语文（下）去了，那么表中将不存在一年级语文（上），也就没了《小学语文1》。这时候，校长问：一年级语文（上）用的什么教材啊？……郁闷了吧?(删除异常) 

  3、校长说：一年级语文（上）换教材，换成《大学语文》。有10000个学生选了这么课，改动好大啊！改累死了……郁闷了吧？（修改异常） 

  那应该怎么解决呢？投影分解，将一个表分解成两个或若干个表 

学生	课程	老师	老师职称	教室	上课时间
小明	一年级语文（上）	大宝	副教授	101	14：30

  学生上课表新 

课程	教材
一年级语文（上）	《小学语文1》

 
 第三范式 3NF(符合2NF 且 消除传递依赖 ) 

  上面的“学生上课表新”符合2NF，可以这样验证：两个主属性单独使用，不用确定其它四个非主属性的任何一个。但是它有传递依赖！ 

  在哪呢？问题就出在“老师”和“老师职称”这里。一个老师一定能确定一个老师职称。问题（ 
 老师->(学生，学生课程)->老师职称？） 

  有什么问题吗？想想： 

  1、老师升级了，变教授了，要改数据库，表中有N条，改了N次……（修改异常） 

  2、没人选这个老师的课了，老师的职称也没了记录……（删除异常） 

  3、新来一个老师，还没分配教什么课，他的职称记到哪？……（插入异常） 

  那应该怎么解决呢？和上面一样，投影分解： 

学生	课程	老师	教室	上课时间
小明	一年级语文（上）	大宝	101	14：30

老师	老师职称
大宝	副教授

 
 BCNF (符合3NF 且主属性不依赖于主属性) 

  若一个关系达到了第三范式，并且它只有一个候选码，或者它的每个候选码都是单属性，则该关系自然达到BC范式。 

  数据依赖的公理系统（这里引用 
 http://www.2cto.com/database/201505/397479.html 且不完全） 

  这里我非常不熟悉。。。。各位，请到该网址去看吧，不然我怕会误导。 

  数据库设计 

  1.需求分析 

  数字字典 

  全系统中的数据项 

  数据结构 

  数据流 

  数据存储描述 

  2.概念结构设计 

  E-R图 

  实体：正方形 

  属性：椭圆 

  联系：菱形 

  数据字典 

  数据项描述={数据项名,数据项含义说明,别名,数据类型,长度,取值范围,取值含义,与其他数据项的逻辑关系} 

  数据结构描述={数据结构名,含义说明,组成:{数据项或数据结构}} 

  数据流描述={数据流名,说明,数据流来源,数据流去向,组成:{数据结构},平均流量,高峰期流量} 

  数据存储描述={数据存储名,说明,编号,输入的数据流,输出的数据流,组成:{数据结构},数据量,存取频度,存取方式} 

  处理过程={处理过程名,说明,输入:{数据流},输出：{数据流},处理：{简要说明}} 

  3.逻辑结构设计 

  数据模型（就是各种表格和表格间的关系） 

  4.物理结构设计 

  存储安排 

  存取方法选择 

  存取路径建立 

  5.数据库实施 

  创建数据库模式 

  装入数据 

  数据库试运行 

  6.数据库运行和维护 

  性能检测 

  转储 

  恢复 

  数据库重组 

  重构