三级数据库随笔（持续更新~）

0202ohh

已于 2022-03-13 17:22:20 修改

阅读量385

点赞数

分类专栏：数据库基础文章标签：数据库 database

于 2022-02-26 19:20:55 首次发布

本文链接：https://blog.csdn.net/weixin_62917800/article/details/123152157

版权

数据库基础专栏收录该内容

11 篇文章 5 订阅

订阅专栏

1.关系模式描述关系的静态结构，而关系是动态的、随用户对数据库的操作而改变。

2.手动删除tempdb中的日志文件会破坏数据库的安全性和可靠性。

3.复制数据库的方法有：

1）使用复制数据库向导在服务器之间复制或移动数据库。

2）还原数据库备份，若要复制整个数据库，可以使用BACKUP和RESTORE Transact-SQL语句。

通常，还原数据库的完整备份用于各种原因将数据库从一台计算机复制到另一台计算机。

4.用户定义的完整性可以用CHECK短语指定列值应满足的条件，也可以用触发器约束，通过服务器自动激活相应的触发器，对数据进行完整性控制。但DEFAULT约束不能实现用户自定义的完整性，只能表示实体或参照完整性。

5.用户若想在SQL Server中访问数据库的表，必须同该表建立一个连接表示通信渠道，当连接中断时，无法对其进行访问。

6.当用户被赋予的两种角色的权限出现冲突时，为了安全起见，都是DENY优先。

7.传统的索引如有序索引、树型索引都是建立在“比较”上的，即在结构中查找记录时需要进行一系列与关键字的比较。散列索引（哈希索引）不采用索引键值比较，而是采用一定的计算方法定位数据。

8.系统数据库master、model、msdb因为被修改地较少，且对数据库系统影响较大，所以每次修改后应及时备份；而用户自定义的数据库在使用过程中会经常不定期的修改，而且每次修改量不大，如果每次修改后重新备份则对系统操作冗余性较大，所以采用定期备份；而tempdb是系统临时文件的数据库，每次启动后都会清空，所以没必要备份。

9.文件备份主要是对数据库中数据文件的备份，不对日志文件备份，因此在备份完成之后必须再对日志进行备份。

10.分布式数据库

1）其分布透明性由大到小依次为：分片透明性、位置透明性、局部数据模型透明性。

2）其特点是：本地自治、非集中式管理、高可用性、位置独立性、数据分片独立性。

3）其事务管理包括恢复控制和并发控制，恢复控制一般采用的策略是基于两阶段提交协议。

4）其数据分布策略为：水平和垂直分片。水平分片后可以在需要时重构关系；垂直分片通过连接方法恢复关系。

11.并行数据库常用的划分技术有：转轮法、散列划分、范围划分。

1）转轮法：对关系顺序扫描将第i个元组存储在标号为Dimod的磁盘上；该方式保证了元组在多个磁盘上均匀分布。

2）散列划分：选定一个值域为{0，1，...，n-1}的散列函数，对关系中的元组基于划分属性进行散列。如果散列函数返回i，则将其存储到第i个磁盘上。

3）范围划分：该策略按照关系中某个属性的取值范围将数据文件划分为几部分，分别存放到磁盘上。

由此可见，转轮法最适合扫描整个关系的应用，并在扫描时可以并行地从几个磁盘读取数据，负载平衡，充分发挥了并行性。

12.数据定义语句经过数据定义语言（DDL）编译器编译过后，各种对象的描述信息存放在数据库的数据字典。数据字典通常包括：数据项、数据结构、数据流、数据存储和处理过程。

13.数据模型通常由数据结构、数据操作和完整性约束构成。

14.UML中的顺序图主要用于描述系统内对象之间的消息发送和接收序列。它有两个坐标轴，纵向表示时间的持续过程，横向表示对象，每一个对象用矩形框表示，纵向的虚线表示对象在序列中的执行情况。

15.两个关系R与S在做自然连接时，选择两个关系在属性上值相等的元组构成新的关系。关系R中某些有可能在S中不存在公共属性上值相等的元组，从而造成R中这些元组在操作时被舍弃，同样，S中某些元组也可能被舍弃。如果把舍弃的元组也保存在结果关系中，而在其他属性上填空值，那么这种连接就叫做外连接。

16.WITH TIES一般是和TOP、ORDER BY相结合使用，表示包括与最后一行ORDER BY后面的参数取值并列的结果。

16.数据存储的基本单位页。为数据库中的数据文件分配的磁盘空间可以从逻辑上划分为页，磁盘I/O操作在页级执行。也就是说SQL Server读取或写入所有数据页。在SQL Server中，页的大小为8KB，也就是说在SQL Server数据库中每MB有128页，每页的开头是96字节的标头，用于存储有关页的系统信息，此信息包括页码、页类型、页的可用空间以及拥有该页的对象的分配单元ID。行不能跨页，但是行的部分可以移出行所在的页，因此实际可能非常大。页的单个行中的最大数据量和开销是8060字节。

17.PRIMARY KEY约束多为强调主键不可出现相同值，UNIQUE约束可以强制一列或多列组合（不是主键）的唯一性。且PRIMARY KEY不允许出现空值，UNIQUE允许出现空值。

18.数据库管理系统一般通过周期性检查事务等待图来实现死锁检测。

19.并行数据库服务器分为两种结构：完全共享资源结构、完全不共享资源结构。完全共享资源结构指对每个数据项的存取都要经过公共通信路线，其所有的处理器共享内存、磁盘等资源。完全不共享资源结构指高功能计算机系统由多个较小的系统替代，每个站点都要实现全局数据目录，每个站点有独立的内存和磁盘对应该站点的服务器。

20.数据仓库是一个面向主题的、集成的、非易失的、且随时间变化的数据集合。

21.粒度问题是设计数据仓库的一个最重要的方面。粒度指数据仓库的数据单位中保存数据的细化或综合程度的级别。细化程度越高，粒度级就越小；反之亦然。

22.EXEC sp_addsrvrolemember是登录账户权限之意，sp_addsrvrolemember是定义好的存储过程，其作用是为登录账户赋角色权限。数据库主要的角色权限如下表：

bulkadmin	执行BULK INSERT语句
dbcreator	创建、修改、删除和还原数据库
diskadmin	管理磁盘文件
processadmin	管理在SQL Server实例中运行的进程
securityadmin	管理服务器登录账户
serveradmin	配置服务器范围的设置
setupdamin	添加和删除链接服务器
sysadmin	在SQL Server中进行任何活动，该角色的权限跨越所有其他固定服务角色

23.查询处理器的功能是为编译好的查询语句生成执行计划，并根据执行计划访问相关数据。

24.前触发型触发器只执行触发器指定的内容而不执行引发触发器的SQL语句。

25.model数据库为新创建的数据库提供模板。

26.当用CHECK进行约束条件限制时，若其只涉及对某一列的约束则可以放在该列后面，如果是约束条件中涉及两列或两列以上，则为对整个数据表的约束，放在表的最后面。

27.视图在SQL语句相同情况下不能提高效率。

28.当数据库管理系统检测到死锁后，可以采用撤销死锁事务的方式接触死锁。

29.位图索引一般在范围查询时使用。

30.在进行数据恢复时，首先恢复完全备份，其次恢复差异备份，最后恢复日志备份。备份日志时使用Norecovery来备份尾日志，这样备份日志的时候数据库处于恢复状态，别的进程就不能再访问数据库，日志就不会再增加，因此在还原的时候就可以正常恢复。还原备份的时候如果想同时还原之后的日志，必须加上Norecovery才可以还原，如果有多个日志备份，除了最后一个日志备份外，还原其他日志也必须加上Norecovery。

31.master数据库是SQL Server系统里面最重要的数据库，因为它包含了系统中的有关数据库的所有信息。对master数据库只能进行完全数据库备份操作。

32.并行数据库的主要目的是通过高速通信介质连接多个可独立处理的单元以并行执行的方式完成对数据库系统的互联查询、内部查询以及各种内部操作。

33.多维划分：维是人们观察事物的角度，同样的数据从不同的维进行观察可能会得到不同的结果，而每个维度又可按粒度的不同划分为多个层次。

34.分布式数据库的分配方式包括集中式、分割式、全复制式、混合式。集中式指所有数据片段都安排在一个场地上；分割式指全局数据有且只有一份，它们被分割成若干片段，每个片段被分配在一个特定场地上；全复制式是在每个站点上都有全局数据的复制样本，数据的冗余性最大；混合式指全局数据被分为若干个数据子集，每个子集被安排在一个或多个不同的场地上，但是每个场地未必保存所有数据。

35.OLTP是对数据库联机的日常操作，通常是对一条事务的查询和修改，要求快速相应用户的请求，对数据的安全性、完整性及事物吞吐量要求很高。而OLAP是对数据的查询和分析操作，通常是对海量历史数据的查询和分析，要访问的数据量非常大，查询和分析操作十分复杂。OLTP为宏观分析，面向中上层和决策者使用，OLAP为微观操作，面向企业的中下层业务人员使用。

36.组件图提供系统的物理视图。UML图形中组件图的用途是显示系统中的软件对其他软件组件的依赖关系，它可以在一个非常高的层次上显示，从而仅显示粗粒度的组件，也可以在组件包的层次上显示。

37.COUNT() 函数返回匹配到指定条件的记录行数。

38.在数据库中，常用的一个流水编号通常会使用IDENTITY栏位来进行设置，这种编号的好处是不会重复，而且是唯一的。（标识列对应IDENTITY）

39.三级加锁协议也称为三级封锁协议，它保证正确地调度事务地并发操作，是事务对数据库对象加锁、解锁必须遵守的一种规则。

40.数据库的转储机制一般有完全转储、差量转储和增量转储。完全转储是对整个数据库中的数据全部备份，效率低，时间长；差量转储指基于上一次完全转储基点之后变化转储，是对上次转储之后对所有文件中修改或删除的记录的转储，效率高，时间短；增量转储是对数据库中凡是有记录变化的文件的整个文件进行复制，效率介于前两种转储方式之间。

41.WHERE子句常用的查询条件

查询条件	谓词
比较	=,>,<,>=,<=,!=,<>,!>,!<;NOT+上述比较符
确定范围	BETWEEN AND,NOT BETWEEN AND
确定集合	IN,NOT IN
字符匹配	LIKE,NOT LIKE
空值	NULL,IS NULL
多重条件	AND,OR,NOT

42.WHERE 子句中是不能用聚集函数（COUNT(),AVG(),SUM()等）作为条件表达式的。聚集函数只能用于SELECT子句和GROUP BY 中的HAVING子句。

43.WITH CHECK OPTION表示对视图进行UPDATE,INSERT和DELETE操作时要保证更新、插入或删除的行满足视图定义中的谓词条件（即子查询中的条件表达式）。

44.RAID10比RAID5在写数据上更稳定、速度更快。

45.INSERTED表用于存储INSERT和UPDATE语句所影响行的新值的副本，DELETED表用于存储DELETE和UPDATE语句所影响行的旧值的副本。

46.创建索引视图的步骤：

1）使用SCHEMABINDING子句来创建一个视图。这个视图必须符合许多要求，例如，它只能引用同一数据库中的基表，而不能是其他标准视图。所有引用的函数必须是确定性的，行集函数、派生表和子查询都不能在索引视图中引用。

2）在视图上创建一个唯一索引。这个索引的叶子级由视图的完整结果集组成。

3）在聚集索引的基础上根据需求创建非聚集索引。非聚集索引可以按平常的方式创建。

4）创建并使用索引视图。

47.索引视图有提高下列查询类型的性能：

1）处理大量行的联结和聚合。

2）许多查询经常执行联接和聚合操作。

3）决策支持工作负荷。

索引视图通常不会提高下列查询类型的性能：

1）具有大量写操作的OLTP系统。

2）具有大量更新的数据库。

3）不涉及聚合或联接的查询。

4）GROUP BY键具有高基数度的数据聚合。高基数度表示列包含许多不同的值。

48.在“Windows身份验证模式”下，所有Windows用户登录到SQL Server服务器都无需再提供用户名和密码，但SQL Server会从用户登录到Windows时提供的用户名和密码查找档当前用户的信息，判断其是否是SQL Server的合法用户，不是，则拒绝登录。

49.RAID5需要3块硬盘，并把数据和相对应的奇偶校验信息存储到组成RAID5的各个磁盘上。其中任意N-1块磁盘上都存储完整的数据，也就是说有相当于一块磁盘容量的空间用于存储奇偶校验信息。

50.在数据库概念设计阶段，采用自下而上的ER设计。

51.数据库应用系统的需求包括：数据需求分析、数据处理需求分析，业务需求分析及其在性能、存储、安全、备份和恢复等方面的要求。数据需求分析的主要工作是从用户视图出发，分析与辨识应用领域所管理的各类数据项和数据结构，形成数据字典的主要内容。

52.避免或简化排序的目的是实现查询优化。使用游标会占用较多的系统资源，尤其对于大规模并发量的情况下，很容易使得系统资源耗尽而崩溃，而使用临时表能够加速查询。相关子查询的使用不能加速查询。

53.常见的数据挖掘任务包括分类、估计、预测、相关性分组或关联规则、聚类和描述、可视化以及复杂数据类型挖掘等。分类分析首先从数据中选出已经分好类的训练集，在该训练集上运用数据挖掘分类的技术，建立分类模型，对于没有分类的数据进行分类。

54.RecordSet对象用于操作来自提供者的数据。使用ADO时，通过RecordSet对象可对几乎所有数据进行操作，所有RecordSet对象均使用记录（行）和字段（列）进行构造。RecordSet常用的方法为：1）AddNew，创建一条新纪录。2）Cancel撤销一次执行。3）Close关闭一个RecordSet。4）Delete，删除一条记录或一组记录。5）MoveNext，把记录指针移动到下一条记录。

55.稀疏索引是指如果只是一部分查找码的值有对应的索引记录；稠密索引是指如果数据文件中的每一个查找码值在索引文件中都对应一个索引记录；对于数据文件和它的一个特定的索引文件，如果数据文件中的数据记录的排列顺序与索引文件中索引项的排列顺序相一致，或者说，索引文件按照其查找码指定的顺序与数据文件中数据记录的排列顺序相一致，则称该索引文件为聚集索引。

56.事务调度分为串行调度和并发调度。串行调度的特点是一个事务的所有操作都执行完后才开始执行另一条事务，不存在事务操作的交叉执行。不同事务的交叉执行称为并发调度，DBMS交叉执行来自多个事务的各个操作，以提高数据库系统的性能。

57.事务日志用于保存对数据的更新操作：事务日志是一个与数据库文件分开的文件，它存储对数据库进行的所有更改，并记录全部插入、更新、删除、提交、回退和数据库模式变化等操作。

58.对数据库系统的监控分为手动监控机制和自动监控机制。

59.数据仓库的数据来自多种数据源。不同的数据源可能由不同的平台开发，使用不同的数据库管理系统，数据格式也可能不同。源数据在被装载到数据仓库之前，需要进行一定的数据转换。数据转换的主要任务是对数据粒度以及不一致的数据进行转换。

60.堆文件也称为无序文件。在堆文件中，记录随机地存储在文件物理空间中，新插入的记录存储在文件的末尾。

61.通信图（协作图）是表达对象之间的联系（顺序图不表达）以及对象之间发送和接收消息的图。

62.对于处理百万级以上的数据查询，针对数据库系统本身及网络传输过程中可能的一些调优方案：

1）把数据、日志、索引放到不同的I/O设备上，增加读取速度，数据量越大，提高I/O越重要。

2）纵向、横向分割表，减少表的尺寸。

3）升级硬件，扩大服务器的内存。配置虚拟内存，虚拟内存的大小应基于计算机上并发运行的服务进行配置。增加服务器CPU个数。

4）分布式分区视图可用于实现数据库服务器联合体。联合体是一组分开管理的服务器，但它们相互协作分担系统的处理负荷。这种通过分区数据形成数据库服务器联合体的机制能够扩大一组服务器，以支持大型的多层Wed站点的处理需要。

5）重建索引 DBCC REINDEX，DBCC INDEXDEFRAG，收缩数据和日志 DBCC SHRINKDB，DBCC SHRINKFILE。设置自动收缩日志，对于大的数据库不要设置数据库自动增长，它会降低服务器的性能。

6）优化锁的结构。

优化SQL查询语句：

1）对查询进行优化，应尽量避免全局扫描，首先应考虑在WHERE及GROUP BY涉及的列上建立索引。

2）应尽量在WHERE子句中使用!=或<>操作符，否则引擎将放弃使用索引而进行全年表扫描。

3）任何地方都不要使用select * from 进行全表扫描，用具体的字段代替“*”，不要返回冗余字段。

4）避免频繁创建和删除临时表，以减少系统表资源的消耗。

5）尽量避免使用游标，因为游标的效率较差，如果游标操作的数据超过1万条，就应该考虑改写。

6）尽量避免大事务操作，提高系统并发能力。

63.数据字典一般由数据库管理系统本身管理和维护。

64.数据库空间占用情况不是DBAS性能指标。

65.常用的需求建模工具有：UML、DFD、IDEF0。

66.DFD图采用自顶向下逐步细化的结构化分析方法。

67.聚集索引的键值可以重复。

68.数据库物理设计的目的是将数据的逻辑模式转换为实现技术规范，其目标是设计数据存储方案，以便提供足够好的性能确保数据库数据的完整性、安全性和可恢复性。通常，数据库物理设计并不包括文件和数据库的具体实现细节（例如如何创建文件、建立数据库以及如何加载数据等）。

69.事务日志能够实现数据恢复而不是数据转储。

70.数据库应用系统总体设计范畴为：确定DBAS体系结构、软硬件选型和配置设置、应用软件总体设计和业务规则初步设计。

71.DBMS数据字典、数据库结构证明文档、前端应用程序表中数据库的定义及说明文档都是元数据。

72.事务的原子性描述的是事务中包括的诸多操作为了保持一致性要么都做，要么都不做。一致性描述的是事务执行结果从一个一致性到另一个一致性的变化。

73.SQL Server 2008对数据库提供的备份有：完全备份和差异备份。

74.分布式数据采用数据分片对数据进行管理，分片有以下三个原则：

1）完整性原则，即全局关系的所有数据项必须包含在某个片段中，否则将导致数据库不完整，造成某些片段数据丢失。

2）重构性原则，即所有片段必须能够还原全局关系。

3）不相交原则（对垂直分片的主键除外），对于一个全局关系，要保证数据不丢失，则必须要属于某个片段，即不允许不属于任何一个片段，也不允许一个全局关系的某些数据既属于该全局关系的某些片段又属于该全局关系的另一个片段。

75.根据索引的实现方式，索引分为：有序索引和散列索引。

76.分布式数据库总的数据分布策略可以从数据分片和数据分配两个角度来考虑，一般先数据分片，再数据分配。分片是对关系的操作，而分配是对分片结果的操作。分片模式是描述每个数据片段以及全局关系到片段的映像，分配模式是描述各片段到物理存放场地的映像。

77.SQL Server有五种约束，分别是主键约束(PRIMARY KEY)、外键约束(FOREIGN KEY)、唯一约束(UNIQUE)、缺省约束(DEFAULT)和检查约束(CHECK)。

78.OLAP的实现技术主要分为以下三类：

1）基于关系型数据库的OLAP（ROLAP，Realation OLAP）。

2）基于多维数据库的OLAP（MOLAP，Multidimension OLAP）。

3）混合型OALP（HOLAP，Hybrid OLAP）。

79.备份和转储不同。

80.UNION操作符用于合并两个或多个SELECT语句的结果集。请注意，UNION内部的SELECT语句必须拥有相同数量的列，而且对应列的语义应该相同。列也必须拥有兼容的数据类型。同时，每条SELECT语句中的列的顺序必须相同。

81.SQL Server 的数据恢复模式有三种：

1）简单恢复模式，此方法可以最大幅度减少事务日志的管理开销，因为恢复模式不备份事务日志。但是如果数据库损坏，则简单恢复模式将面临极大的数据丢失风险。在这种恢复模式下，数据只能恢复到最新备份状态。因此对于此用户数据库，简单恢复模式只适用于测试和开发数据库，或用于包含只读数据的数据库。

2）完整恢复模式，此方法可以完整的记录所有事务，并将事务日志记录保留到对其备份完备为止。此方法相对于简单恢复模式来说，更占用时间。

3）大容量日志恢复模式，此方法只对大容量操作进行最小记录，使事务日志不会被大容量加载操作所填充。

在数据导入过程中，所有的业务都是暂停的，因此可以采用简单恢复模式提高数据导入速度。且只在数据导入的过程中暂时的修改恢复模式，因此数据并不会丢失。

82.数据库应用系统逻辑设计阶段工作内容分为三部分：数据库逻辑结构设计、数据库事务概要设计、应用程序概要设计。

83.从功能上讲，数据库应用系统设计包括以下四个层次：

1）表示层，位于最外层，离用户最近，用于显示数据和接受用户输入的数据。

2）业务逻辑层，表示层和数据访问层之间通信的桥梁，主要负责数据的传递和处理，例如数据的有效性检验、业务逻辑描述相关功能。业务逻辑层概要设计包括：结构、行为、数据接口、故障处理、安全设计、系统维护与保障等方面的内容。

3）数据访问层，主要实现对数据的保存和读取操作。

4）数据持久层

84.虽然关系数据库均采用比较同一的SQL语句对数据库中的数据进行维护，但是不同的数据库产品提供不同的应用程序接口，因此在更换数据库产品后，一般原有的应用程序和数据库的接口会失效。

85.聚类将一个数据集中的数据进行分组，使得每一组内的数据尽可能相似而不同组间的数据尽可能的不同。它与分类的一个不同点在于，它强调同一个组的对象有较高的相似度，不同组的对象之间差别很大。分类和聚类的区别在于，分类事先直到有哪些类别可以分。聚类事先不知道将要分成那些类，需有聚类算法来自动确定。

86.ODS（Operational Data Store）是数据仓库体系结构中的一个可选部分，ODS具备数据仓库的部分特征和OLTP系统的部分特征，它是“面向主题的、集成的、当前或接近当前的、不断变化的”数据。第一类ODS更新频率是秒级，第二类ODS的数据更新频率是小时级，第三类是天级。上述三类是根据数据更新的速度划分的。第四类是根据数据来源方向和类型划分的。

87.协作图主要用于描述对象在空间中如何交互，即除了动态交互，它也直接描述了对象如何链接在一起的情形。状态图主要用户描述一个对象在其生存期间的动态行为，表现为一个对象所经历的状态序列，引起状态转移的事件，以及因状态转移而伴随的动作。

88.每个游标都有一个当前行指针，当游标打开后，当前行指针自动指向结果集的第一行数据，INSENTITIVE关键字用以创建由该游标使用的数据的临时复本。对游标的所有请求都从tempdb中的临时表中得到应答。因此，在对该游标进行提取操作时，返回的数据中不反映对基表所做的修改，并且该游标不允许修改。使用SQL-92语法时，如果省略INSENTITIVE，任何用户对基表提交的删除和更新都反映在后面的提取中。当@@FETCH_STATUS=0时，表示的含义是FETCH语句成功，等于-1时，FETCH语句失败或行不在结果集中，等于-2时，提取的行不存在。关闭游标后，可再用OPEN语句打开该游标。

89.日志备份仅备份日志，不备份数据；日志备份的执行效率通常比差异备份和完整备份高；日志备份的时间间隔通常比差异备份短。

90.内联表值函数的返回值是一个表，该表的内容是一个查询语句的结果；内联表值函数的使用与视图非常相似，需要放在查询语句的FROM子句中，作用很像是带参数的视图。内联表值函数通过SELECT语句所填充函数返回的表值。

91.对于前后都是%的列查询不会访问索引。

92.UML语义的四层建模概念框架分别是：元元模型层、元模型层、模型层、用户模型层。

93.Google的云数据库是一个分布式的结构化数据存储系统，称为Big table。

94.知识发现过程由以下三个阶段组成：数据准备、数据挖掘和解释评估。

95.日志文件主要有两种格式：以记录为单位的日志文件和以数据块为单位的日志文件。

96.双机热备属于数据库恢复技术内容。

97.散列文件是指利用散列存储方式组织的文件，亦称为直接存取文件。散列文件的优点是：文件随机存放；插入删除方便；存取速度快；不需要索引区，节省存储空间。其缺点是：不能进行顺序存储，只能按关键字随机存取，且询问方式只限于简单询问，并且在经过多次插入、删除后也可能造成文件结构不合理，需要重新组织文件。

如果一个基本表的数据量很少，并且插入、删除、更新等操作非常频繁，该基本表可以采用堆文件组织形式。因为堆文件无需建立索引，维护代价非常低。虽然堆文件的数据访问效率低，但在数据量少的时候，定位文件记录的时间非常段。

顺序文件指的是文件信息存放在若干连续的物理块中，其优点是简单的，支持顺序存取和随机存取，顺序存取速度相对较快。缺点是文件不能动态增长，不利于文件插入和删除。如果用户的查询条件定义在查找码上，则顺序文件是比较适合的文件结构。

聚集文件将不同关系表有关联关系的记录存储在一起。如果某些重要而频繁的用户查询经常需要进行多表连接操作，可以考虑聚集文件，来改善查询效率。

98.使用绑定连接可以减少死锁。

99.活动图用于描述系统、用例和程序模块中逻辑流程的执行次序、并行次序。

100.使用触发器实现数据完整性的效率通常低于CHECK约束。

101.检查点应当由数据库恢复子系统自动的定期或不定期的建立，而不应当由数据库管理员手动建立。

102.主-备方式（Active-Standby）即指的是一台服务器处于某种业务的激活状态（即Active状态），另一台服务器处于备用状态（即Standby状态）。该方式的特点是当Active状态服务器出现故障的时候，通过软件诊断将Standby机器激活，保证系统在最短时间内恢复使用。

103.恢复要求如果符合下列任意要求，则使用完整恢复模式：您必须能够恢复所有数据；数据库包含多个文件组，并且您希望逐段还原读/写辅助文件组（以及可选的还原只读文件组）；您必须能够恢复到故障点；您希望可以还原单个页；您愿意承担事务日志备份的管理开销。

104.SQL Server支持对数据库中的一个数据文件进行还原的操作，在还原过程中数据库自动处于脱机状态，其他的文件都不能进行读写操作，因此将受到一定的影响。

105.快照：该方法通过对当前数据表进行“照相”，记录当前的数据表信息“相片”，然后将当前的“相片”与以前的数据表“相片”进行比较，如果不一致将通过一定的方式传到数据仓库，从而实现数据的一致性，这种方式适合于更新频率较低的数据表。

106.位置透明性使用户编写程序时只需要考虑数据分片情况，不需要了解各分片在各个场地的分配情况。

107.局部数据模型透明性指用户或应用程序要了解分片及各分段存储的场地，但不必了解场地上使用的是何种数据模型。

108.开窗函数公式：函数名（列）OVER（选项）。OVER关键字表示把函数当成开窗函数而不是聚合函数。SQL Server 2005/2008支持两种开窗函数，分别为：排名开窗函数和聚集开窗函数。聚合开窗函数只能使用PARTITION BY子句不带任何语句，ORDER BY不能与聚合开窗函数一同使用。很多聚合函数都可以作窗口函数的运算。

109.分布式数据库分片类型：

1）水平分片

2）垂直分片

3）导出分片：又称为导出水平分片，即水平分片的条件不是本关系属性的条件，而是其他关系属性的条件。

4）混合分片：以上三种方式的混合。

110.常用的OLAP多维分析操作有切片、切块、旋转、钻取和卷起，通过这些操作，使用户能够从多个角度侧面观察数据。卷起是在数据立方体中执行聚集操作，通过在维级别中上升或通过消除某个或某些维来观察更概括的数据。钻取是通过在维级别中下降或通过引入某个或某些维来更细致的观察数据。切片和切块实现局部数据的显示，帮助用户从众多混杂的数据中进行选择。旋转就是改变维的方向。

111.在数据仓库中，元数据主要分为技术元数据和业务元数据。

112.K-means算法是基于距离的聚类算法，采用距离作为相似性的评价指标，即认为两个对象的距离越近，其相似度就越大。

113.聚类是一类常见的机器学习方法，聚类算法所处理的数据对象一般都没有标记，因此聚类一般也称为无监督/无教师/无老师的学习方法。与分类相比，分类的例子或数据对象均有类别标记，而聚类的例子则没有标记，需要由聚集算法来自动确定。

114.在分类预测任务中，需要用到的数据一般包括训练集、测试集和验证集。

115.时间序列分析也可以称为数据演变分析，它能描述行为随时间变化的对象的规律或趋势，并对其进行建模。

116.在数据仓库的导出数据或物化视图的维护策略中，只有在用户查询时发现数据已经过期才进行更新的策略称为延时维护策略。

117.分类器的构造方法有统计方法、机器学习方法、神经网络方法等。统计方法包括贝叶斯法和非参数法；机器学习方法包括决策树法和规则归纳法；神经网络方法主要是BP算法。K-means属于聚类算法。

118.数据仓库维护的基本思想是：根据某种维护策略，在一定条件下触发维护操作；维护操作捕捉到数据源的数据变化；通过一定策略对数据仓库中的数据进行相应的操作，以保持两者的一致性。增量式维护指的是根据数据源的变化量在维护对象原有数据和基础上进行数据添加和修改。

119.监督学习是指利用一组已知类别的样本调整分类器的参数，使其达到所要求性能的过程，也成为监督训练或有教师学习。常见应用场景如分类问题和回归问题。

120.在ODS上可实行的全局应用大致可分为：实现企业全局的OLTP操作、实现即时的OLAP操作。

121.数据在网络中传输时，则是以整个关系（也可以是片段）传输，显然这是一种冗余的方法，在一个关系传输到另一场地后，并非每个数据都参与连接操作，因此，不参与连接的数据或无用的数据不必在网络中来回传输。采用半连接操作即可在网络中只传输参与连接的数据。

122.分布式数据库系统由局部数据库管理系统、全局数据库管理系统GDBMS、全局数据字典、通信管理。

123.全局外模式是全局应用的视图，即终端用户看到的逻辑上并未分布的表、视图等；全局概念模式用于描述全体数据的逻辑结构及特征；分片模式用于描述每个数据片段以及全局关系到片段的映像，是分布式数据库系统中全局数据的逻辑划分视图；分配模式用于描述各片段到物理存放场地的映像；局部概念模式用于描述全局关系在场地上的物理片段的逻辑结构及特征；局部内模式用于描述局部概念模式涉及的数据在本地场地的物理存储。

124.在SQL Server 2008中，可以在查询语句里加入FOR XML子句实现XNL格式返回查询结果。

125.用户数据库的数据文件的主要拓展名为MDF。

0202ohh

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
三级数据库随笔（持续更新~）

1.关系模式描述关系的静态结构，而关系是动态的、随用户对数据库的操作而改变。2.手动删除tempdb中的日志文件会破坏数据库的安全性和可靠性。3.复制数据库的方法有：1）使用复制数据库向导在服务器之间复制或移动数据库。2）还原数据库备份，若要复制整个数据库，可以使用BACKUP和RESTORE Transact-SQL语句。通常，还原数据库的完整备份用于各种原因将数据库从一台计算机复制到另一台计算机。4.用户定义的完整性可以用CHECK短语指定列值应满足的条件，也可以用触发器约束，通
复制链接

扫一扫