自我介绍:讲了下个人情况,说了下项目
项目为什么使用Hbase:因为HBase的可扩展性好
项目的结构
数据的来源
Mysql的三范式:
- 1NF要求属性具有原子性,不可再分解
- 2NF要求记录具有唯一标识,即实体的唯一性,即不存在部分依赖
- 3NF要求非主键属性都和主键直接相关,不存在间接相关
Mysql的InnoDB和MyISAM的区别:
- InnoDB支持事务,MyISAM不支持
- InnoDB支持外键
- InnoDB是聚集索引,MyISAM是非聚集索引
- InnoDB不支持具体的行数;InnoDB的最小锁的粒度是行锁,MyISAM的最小粒度是表锁
Mysql的隔离级别:
- 未提交读:即未提交也读,事务中间也可以读,容易产生脏读、幻读、不可重复读
- 提交度:只有在事务提交之后才可以读,避免了脏读,但是无法避免不可重复读、幻读
- 可重复读:在事务提交的时候,不可以读和修改数据,避免了脏读和不可重复读。
- 串行读:隔离级别最高,所有的事物都是串行化执行,避免了脏读、幻读和不可重复读
MR的过程:
Spark宽依赖、窄依赖的定义
Spark中DAG的stage的划分
一道快排算法题
一道SQL题