哈工大《大数据计算基础》期末考试

哈工大《大数据计算基础》期末考试

留给学弟学妹们参考

题型:判断、简答、综合题

判断:10 x 2分 非常简单,记不住了

简答:4 x 5分

  • Spark RDD是什么及特点?

  • 大数据算法中采样技术在哪些算法中有应用(AMS、水库采样)及如何分析?

  • HDFS写文件流程?

  • NoSQL中CAP理论是什么,能否全部实现?

综合题:60分

  • 亚线性时间算法计算连通分量数的分析,3问15分(算法)
  • 亚线性空间算法不重复元素数算法设计,FM算法的思想,MapReduce编程实现,以及MapReduce流程,6问30分(算法+系统)
  • 高并发环境下大数据计算与管理系统的设计,4问15分(系统)

算法部分复习看课件就足够了,一般不会出太难的题。系统部分不需要完全清楚每个框架的细节,理解基本原理即可,重点在理解如何实现可扩展性、容错性、可靠性、一致性、数据如何划分、发生数据偏斜如何处理、NoSQL和NewSQL的基本理论等内容。

带答案,有利于同学们复习用 1、 数据的正确和相容称之为数据的D__。 A. 安全性 B. 一致性 C. 独立性 D. 完整性 2、 关系模式R中的属性全部都是主属性,则R的最高范式必定是D。 A. 2NF B. 3NF C. BCNF D. 4NF 3、 用于数据库恢复的重要文件是C。 A. 数据库文件 B. 备注文件 C. 日志文件 D. 索引文件 4、 若事务T对数据R加X锁,则其他事务对数据R _D_。 A. 可以加S锁,不能加X锁 B. 不可加S锁,可以加X锁 C. 可以加S锁,也可以加X锁 D. 不能加任何锁 5、任何一个供应商可向任何一个工程供应任何一种零件,该事务规则只能用_C__表示。 A. 一元联系 B. 二元联系 C. 三元联系 D. 四元联系 6、必须使用游标的嵌入式SQL语句的情况是_B_____。 A. INSERT B. 对于已知查询结果确定为多元组时 C. DELETE D. 对于已知查询结果确定为单元组时 7、“脏”数据的读出是_B___遭到破坏的情况。 A. 完整性 B. 并发性 C. 安全性 D. 一致性 8、下面不属于ACID限制的是_D___。 A. 原子性 B. 隔离性 C. 持久性 D. 共享性 9、数据库系统的基础是_D___。 A. 数据结构 B. 数据库管理系统 C. 操作系统 D. 数据模型 10、在登录日志文件时,应该____C____。 A. 将更新数据库与登录日志文件两个操作同时完成 B. 将更新数据库与登录日志文件两个操作按随机的先后顺序完成 C. 先登录日志文件,后写数据库的更新 D. 先写数据库的更新,后登录日志文件
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值