面试题目总结
1.三范式
第一范式:数据库表中的所有字段值都是不可分解的原子值
第二范式:一张表只能描述一件事,所有非关键字段都完全依赖于任一组关键字
第三范式:保证每列都和主键直接相关,不能传递依赖于主属性
2.星形模型和雪花模型
星形模型是维度表直接连接到事实表上,数据有一定的冗余,不需要关联外部表,查询效率相对高
雪花模型,维度表有些没有直接关联到事实表上,而是通过别的维度表关联到事实表上,但是他减少了存储量,可通过联合较小的维表改善查询性能
3.FS-LDM:
FS-LDM是预先构建的逻辑数据模型,利用它可以直接开始数据仓库模型设计。
FS-LDM是一个成熟的产品,有专业的研发团队和市场营销人员以及完善的技
术支持。
在一个集成的模型内支持保险、银行、以及证券代理业务。
提供投资保护
- 是全球金融业数据仓库经验的结晶
- 自1997年以来已有50多个客户实施中得到了成功的应用。
灵活易扩展的设计,采用面向主题的设计方法,满足第三范式,在增加功能的
同时不需要重构整个数据仓库。
是一个纯粹的逻辑数据模型,可以运行在任何数据库和平台上,与Teradata数
据库无关。逻辑模型是不依赖与物理硬件和物理环境的。
4.hadoop的几个组成框架
HDFS:高容错、高可靠性、高可扩展性、高吞吐率分布式文件存储系统。负责海量数据的存储。
Yarn:资源管理调度系统。负责hadoop生态系统中任务的调度和监控。
Mapreduce:基于HDFS,Yarn的分布式并行计算框架。负责海量数据的计算。
4.1mapreduce的工作机制
面试
最新推荐文章于 2023-11-17 19:09:04 发布