9.1
1. 数据仓库: 面向主题的、集成的、相对稳定的、反应历史变化的数据集合。数据进入数据仓库之前应进行清洗和重新格式化,或者说经过ETL(抽取、转换、装载)
2. 数据仓库和OLAP操作都是基于多维数据模型的,维是人们观察数据的特定角度,多维数据模型涉及两类表:维表和事实表。两个常见的多维模式是星型模式和雪花模式,雪花模式将星型模式的维表通过规范化组织成层次结构
3. 数据仓库的存储利用了索引技术来支持更高性能的访问,数据仓库应用是一个典型的客户/服务器结构形式。OLAP服务器的实现可以是关系型ROLAP,也可以是多维MOLAP
4. 向下钻取是使用户在多层数据中展现渐增的细节层次,获得更多的细节性数据
9.2
1. 影响数据挖掘质量的要素有两个,一是所采用的数据挖掘技术的有效性,二是用与挖掘数据的质量和数量
2. 数据挖掘的目标分为:预测、识别、分类和优化
3. 同时满足最小支持阈值和最小可信度的阈值的规则称之为关联规则
4. 发现所有的频繁项集和它们的支持度的值是一个主要问题,关联规则的挖掘一般分为两个过程:找出所有的频繁项集、由频繁项目产生关联规则,常用的关联规则算法有Apriori算法、采样算法等
5. 分类是有监督的学习,可以使用的算法有决策树方法、神经网络、BAYES方法、支持向量机方法等
6. 聚类是无监督的学习算法,比较经典的是k-means算法,BIRCH是一个混合算法
9.3
1. 数据库安全性机制分为自主安全性机制(用于向用户授予特权)和强制安全性机制(用于对多级安全性进行控制)。为了保证数据库的安全性,控制措施有访问控制、推理控制、流控制和加密
2. 数据库管理员(DBA)的职责有:账户创建、权限授予、权限收回和安全性级别指定,同时也负责保证数据库系统的总体安全
3. 使用数据库系统可以在两个级别上分配权限:账户级和关系级,用户级包括create table、modify这种权限。关系的属主拥有这个关系上的所有权限
4. all - or - nothing是在关系上授予和回收权限的自主访问控制技术。典型的安全性级别有:绝密、机密、秘密和无分类
5. 统计数据库安全性技术必须能够禁止对个体数据的检索
6. 公钥加密有6个组成部分:明文、密文、加密算法、解密算法、私钥、公钥。签名的验证者不需要知道任何的秘密数
7. 安全等级:
A类安全等级:级别最高,为验证保护级
B类安全等级:强制保护级
C类安全等级:自主保护级,可划分为C1和C2,用户认为C1系统中所有文档具有相同的机密性
D类安全等级:无保护