数据库设计(概念、逻辑、物理)

数据库设计概述与需求分析:

 

结构设计: 概念结构、逻辑结构、物理结构。

行为设计:功能模型、事务设计、应用设计。

 

 

 

 

 

 

 

 

信息要求、处理要求、安全性与完整性要求。

 

 

概念数据库设计:

 

 

 实体联系模型:

 实体-属性-联系

 

 实体集是相同类型(即具有相同性质或属性)的实体集合。

实体集不必互不相交。

 

 属性是实体集映射到域的函数。具体包括单值/多值属性、简单/复合属性、导出属性。

 

 

 

 

 联系集即为同类联系的集合。

 实体之间的联系既可以使用联系集定义,也可以通过实体属性来表示。

 

 参与约束:部分参与——全部参与。

 联系集的属性:描述性属性

 一个主实体对应的多个弱实体之间可以相互区别。

 

 弱实体必须具有一个或多个属性,使得这些属性可以与主实体集的主码相结合形成相应弱实体集的主码,这样的弱实体属性称为弱实体集的部分码。

 

 

 

 

 

 

 

 

 

 

 

 ISA联系 子类继承父类的所有属性;子类可以拥有自己的属性;联系中具有分类属性。

 不相交约束——可重叠约束。

 完备性约束:完全特化——部分特化。

 

根据min来约束是否强制。

 

 

 

 项目与指导记录一对多 学生导师亦然,但是无法描述项目、学生与导师的多对一关系。

 

 

 概念数据库设计的基本步骤:

 

 

 集中式设计方法——视图综合分析法

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 课程参考的是抽象的图书,可以说是这本书的概念;学生在图书馆里借阅的是真实存在的纸质书,给它们直接合并是不行的,假设映射基数填课程-1-参考-m-图书,一门课程规定了只能参考一种书,这个m只能当m本书来理解,但是又引出了逻辑谬误:参考的是m本一样的书?其实参考的只是“这本书”罢了。将m换成1也是一样的,不能把实体书和概念书混淆。

 事务的设计:

逻辑数据库设计:

 

 形成初始关系数据库模式:

 

 

 

 S包含E的所有简单属性和E的复合属性的简单子属性。(复合属性本身被去掉了)

 将弱实体W(E是它的识别实体集)变换为关系

R包含W的所有简单属性与复杂属性的简单子属性;E的主键与W的部分码组合成为W的主键,E是W参照E的外键。

 为每一个多值属性都建立一个新的关系去表示它。

新生成关系的主键是原关系的主键和多值属性/其简单子属性。

 使用属性表示联系。

1.T的主键作为外键派入S(或反之);联系R的简单属性和复合属性的简单子属性作为简单属性派入S或T。

 2.在1:1联系转化为关系模式的时候,E1实体转换为关系T,E2实体转换为关系S。对于E1和E2之间的1:1联系R,为R建立关系W,W中需要包含T的主键和S的主键,并用T的主键或者S的主键作为W的主键,不是用T的主键和S的主键联合组成W的主键。PPT有误。

 1.不建立新关系,由于是1:n的联系,T的每个实体至多与S的一个实体对应,用T表示R。

S的主键作为外键添入T,联系R的简单属性和复合属性的简单子属性作为简单属性派入S或T。

2. 在1:n联系转化为关系模式的时候,E1实体转换为关系T,E2实体转换为关系S。对于E1和E2之间的1:n联系R,为R建立关系W,W中需要包含T的主键和S的主键,并用E2的主键作为所属关系的主键,R的特定属性作为简单属性放入W。

S和T的主键派入W,既作为外部键也组合起来作为W的主键。

 

 

 

 ISA不相交且完全时,2少存储一次所有学生的学号;并且同时查询学生和本科生/研究生的属性时无需join操作。

ISA有重叠时学生主体的属性重复存储在本科生和研究生关系中;无法定义参照“学号”属性的主外键约束(其他实体可能与学生实体之间存在联系)。

 

 

 

 

 

 

 

 

 

 

 易证互相函数决定推一对一联系。

 

 全键。

 

 函数依赖的公理系统:

 

 

自反律:由平凡函数依赖推得;

 增广律,笛卡尔积不影响依赖的方向;

传递。

 

 

 

 F的闭包是函数依赖的集合;X关于F的闭包是属性的集合。

 

 

 

 S2中W涉及F中的所有右部属性,每次遍历找到当前X中所有元素所决定的右部元素并且加入闭包X直到X不再改变抑或X等于U。

 这里为什么要算A,B决定的属性呢?很简单,自反律得到。

 

 

 

 

 

 

 采用循环证明。

 L类和N类推不出来。R类必能推出来且不参与推导的过程,所以不在候选键中。

 

 

 从LR里找。

 

 

 极小函数依赖集:右部最小(仅有一个属性);左部最小(不存在真子集进行替换);整体最小(不能删减函数依赖)。

 

 

 

 

 

 

消除了非键属性对键属性的部分函数依赖。

 

 插入异常:确定了一个系的住处但是无法存储。

删除异常:学生毕业了,然而系和住处的对应关系也随之删除。

http://t.csdn.cn/aEPkT

 若R∈3NF,则R的每一个非键属性既不部分函数 依赖于候选键也不传递函数依赖于候选键。

 

 

 

 

 没有任何属性对候选键的部分函数依赖和传递函数依赖。

 

 想满足BCNF,就必须保证没有任何属性对候选键的部分函数依赖和传递函数依赖,由这个定义可知传递函数依赖必不可能;如果满足部分函数依赖的话就违背了候选键的定义,可知亦不可能。

 也就是说每一个左部都是候选键才行。

 所有非键属性都完全函数依赖于每个候选键;所有键属性都完全函数依赖于每个不包含它的候选键;没有任何属性完全函数依赖于非码的一组属性。

 

 

 

 

 将函数依赖闭包中属于这个属性集合Ui的依赖拿出来做个集合,为什么还要取一个覆盖呢?也就是它存在等价形式,它的所有等价形式都是F在Ui上的投影。

 

 

 

 关系模式分解优先考虑:分解的无损连接性;函数依赖的保持性

 

 

 由于属性间函数依赖的关系,重新连接回去可能会导致元组变多,也是一种信息丢失。

分成几个表后做自然连接,在内容上与原来的表内容是否等价:分解的无损连接性

  像上表就不符合内容等价性,r被分解成r1和r2,自然连接以后成m_{\rho }(r),容易看出该表与原来r的表增加了几行数据,这些增加的数据有可能是错的,因此数据内容上不等价。 

 

 

 

 

 (也就是说等价的)

 

 

 

利用了最小函数依赖集的性质!神!

 

 

 

计算属性集的闭包和验证无损连接性的过程差不多。

 

 那么,计算极小函数依赖集的闭包就可以拿来做无损连接性的验证。

 

 

 

 显然,CTB为全键且满足BCNF。

 

 

 

 

 

 

 

 

 

 关系模式优化:

 

 

 

 垂直分解必须不损失关系模式的语义(保持无损连接性和函数依赖)

 

 定义关系上的完整性和安全性约束:

 

 http://t.csdn.cn/NCIvR

 子模式定义:

 

 性能估计:

 

 物理数据库设计:

 

关系上定义的索引数并不是越多越好,系统为维护索引要付出代价,查找索引也要付出代价。 

 

 

 

 

  • 2
    点赞
  • 20
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
数据库物理设计(1)全文共2页,当前为第1页。数据库物理设计(1)全文共2页,当前为第1页。物理结构设计 数据库物理设计(1)全文共2页,当前为第1页。 数据库物理设计(1)全文共2页,当前为第1页。 数据库物理设计阶段的任务是根据具体计算机系统(DBMS和硬件等)的特点,为给定的数据库模型确定合理的存储结构和存取方法。所谓的"合理"主要有两个含义:一个是要使设计出的物理数据库占用较少的存储空间,另一个对数据库的操作具有尽可能高的速度。 为了设计数据库物理结构,设计人员必须充分了解所用DBMS的内部特征;充分了解数据系统的实际应用环境,特别是数据应用处理的频率和响应时间的要求;充分了解外存储设备的特性。数据库物理结构设计大致包括:确定数据的存取方法、确定数据的存储结构。 物理结构设计阶段实现的是数据库系统的内模式,它的质量直接决定了整个系统的性能。因此在确定数据库的存储结构和存取方法之前,对数据库系统所支持的事务要进行仔细分析,获得优化数据库物理设计的参数。 对于数据库查询事务,需要得到如下信息: l 要查询的关系。 l 查询条件(即选择条件)所涉及的属性。 l 连接条件所涉及的属性。 l 查询的投影属性。 对于数据更新事务,需要得到如下信息: l 要更新的关系。 l 每个关系上的更新操作的类型。 l 删除和修改操作所涉及的属性。 l 修改操作要更改的属性值。 上述这些信息是确定关系存取方法的依据。除此之外,还需要知道每个事务在各关系上运行的频率,某些事务可能具有严格的性能要求。例如,某个事务必须在20秒内结束。这种时间约束对于存取方法的选择有重大的影响。需要了解每个事务的时间约束。 值得注意的是,在进行数据库物理结构设计时,通常并不知道所有的事务,上述信息可能不完全。所以,以后可能需要修改根据上述信息设计物理结构,以适应新事务的要求。 1. 确定关系模型的存取方法 确定数据库的存取方法,就是确定建立哪些存储路径以实现快速存取数据库中的数据。现行的DBMS一般都提供了多种存取方法,如索引法、HASH法等。其中,最常用的是索引法。 数据库物理设计(1)全文共2页,当前为第2页。数据库物理设计(1)全文共2页,当前为第2页。数据库的索引类似书的目录。在书中,目录允许用户不必浏览全书就能迅速地找到所需要的位置。在数据库中,索引也允许应用程序迅速找到表中的数据,而不必扫描整个数据库。在书中,目录就是内容和相应页号的清单。在数据库中,索引就是表中数据和相应存储位置的列表。使用索引可以大大减少数据的查询时间。 数据库物理设计(1)全文共2页,当前为第2页。 数据库物理设计(1)全文共2页,当前为第2页。 但需要注意的是索引虽然能加速查询的速度,但是为数据库中的每张表都设置大量的索引并不是一个明智的做法。这是因为增加索引也有其不利的一面:首先,每个索引都将占用一定的存储空间,如果建立聚簇索引(会改变数据物理存储位置的一种索引),占用需要的空间就会更大;其次,当对表中的数据进行增加、删除和修改的时候,索引也要动态地维护,这样就降低了数据的更新速度。 在创建索引的时候,一般遵循以下的一些经验性原则: l 在经常需要搜索的列上建立索引。 l 在主关键字上建立索引。 l 在经常用于连接的列上建立索引,即在外键上建立索引。 l 在经常需要根据范围进行搜索的列上创建索引,因为索引已经排序,其指定的范围是连续的。 l 在经常需要排序的列上建立索引,因为索引已经排序,这样查询可以利用索引的排序,加快排序查询的时间。 l 在经常成为查询条件的列上建立索引。也就是说,在经常使用在WHERE子句中的列上面建立索引。 同样,对于某些列不应该创建索引。这时候应该考虑下面的指导原则: l 对于那些在查询中很少使用和参考的列不应该创建索引。因为既然这些列很少使用到,有索引并不能提高查询的速度。相反,由于增加了索引,反而降低了系统的维护速度和增大了空间需求。 l 对于那些只有很少值的列不应该建立索引。例如,人事表中的"性别"列,取值范围只有两项:"男"或"女"。若在其上建立索引,则平均起来,每个属性值对应一半的元组,用索引检索,并不能明显加快检索的速度。 时刻怀有一颗虔诚之心,乐于分享。知识才更有意义。 数据库物理设计(1)

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值