苏先生之大数据面试经验总结（一）

最新推荐文章于 2024-08-09 17:47:29 发布

菜鸟苏先森

最新推荐文章于 2024-08-09 17:47:29 发布

阅读量2k

点赞数 5

分类专栏：笔记文章标签： Hadoop hive

本文链接：https://blog.csdn.net/qq_34116784/article/details/84440520

版权

笔记专栏收录该内容

10 篇文章 0 订阅

订阅专栏

hive的计算是通过什么实现的
hive是搭建在Hadoop集群上的一个SQL引擎，它将SQL语句转化成了MapReduce程序在Hadoop上运行，所以hive的计算引擎是MapReduce，而hive的底层存储采用的是HDFS
yarn和hive的关系
因为hive的底层实现是MapReduce，所以确切的来说是yarn和MapReduce的关系，yarn可以作为MapReduce计算框架的资源调度系统
NameNode和DataNode的通信原理
客户端向DataNode发出RPC请求后，DataNode会向NameNode请求获取block快，NameNode根据DataNode的块报告和心跳, 会返回给DataNode指令. 通过这种方式NameNode间接地和DataNode进行通信，实际上NameNode作为Server端, 是不会主动去联系DataNode的, 只有作为客户端的DataNode才会去联系NameNode.
内部表与外部表的区别
hive创建表的时候通过external修饰的来创建外部表，没有external的则是内部表，当删除内部表时，存储在HDFS的数据将会被一起删除，而删除外部表时，数据则会保留
数据库事务的概念
事务就是单个逻辑工作单元执行的一系列操作，要么都执行，要么都不执行，要满足事务，就得满足原子性、一致性、隔离性、持久性
谈谈HBASE底层的理解
(1)HBASE主要分为HMaster和HRegionServer，HMaster主要负责表和Region的管理，负责表的增删改查，管理HRagionServer的负载均衡和Region的分布，还负责HRegionServer失效后Region的转移
(2)HRegionServer主要负责存储HRegion，每一个HRegion上有多个Hstore(对应表中的列簇)，当写入数据时，Hstore中的memstore会将数据写入缓存，当缓存写满后(默认64M)，会出发flush将缓存里的数据flush到磁盘形成storefile文件，storefile文件是Hfile的轻量级包装，Hfile是附带索引格式的文件

菜鸟苏先森

关注

5
点赞
踩
27

收藏

觉得还不错? 一键收藏
2
评论
苏先生之大数据面试经验总结（一）

hive的计算是通过什么实现的hive是搭建在Hadoop集群上的一个SQL引擎，它将SQL语句转化成了MapReduce程序在Hadoop上运行，所以hive的计算引擎是MapReduce，而hive的底层存储采用的是HDFSyarn和hive的关系因为hive的底层实现是MapReduce，所以确切的来说是yarn和MapReduce的关系，yarn可以作为MapReduce计算...
复制链接

扫一扫