![](https://img-blog.csdnimg.cn/20201014180756754.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
大数据面试
文章平均质量分 89
郎er
我是郎儿,博客当笔记用的。
展开
-
大数据开发超高频面试题!大厂面试必看!包含Hadoop、zookeeper、Hive、flume、kafka、Hbase、flink、spark、数仓等
大数据开发面试题包含Hadoop、zookeeper、Hive、flume、kafka、Hbase、flink、spark、数仓等高频面试题。数据来自原博主爬虫获取!Hadoop一、HDFS文件写入和读取过程可灵活回答 :1)HDFS读写原理(流程)2)HDFS上传下载流程3)讲讲(介绍下)HDFS4)HDFS存储机制回答这个问题之前,我们先来看下机架感知 机制,也就是HDFS上副本存储结点的选择。Hadoop3.x副本结点选择:由上图可知,第一个副本在Client所处的节点上。如原创 2021-08-10 11:06:39 · 1579 阅读 · 0 评论 -
大数据面试(二):Kafka面试题
面试题 01 什么是消息队列?消息队列就是用于当两个系统之间或者两个模块之间实现消息传递时,基于队列机制实现数据缓存的中间件面试题 02 消息队列有什么好处?•实现解耦,将高耦合转换为低耦合•通过异步并发,提高性能,并实现最终一致性面试题03、Kafka是什么?•Kafka是一个基于订阅发布模式的高性能、高吞吐的实时消息队列系统面试题04、Kafka在大数据中用于什么场景下?•用于实时架构中,实现将实时数据采集的数据进行实时存储,供于SparkStreaming或者Flink等工具实现实时.原创 2021-08-08 20:00:02 · 527 阅读 · 0 评论 -
大数据面试(一):Hive面试题
面试题01、 请说下Hive和数据库的区别Hive 和数据库除了拥有类似的查询语言,再无类似之处。1)数据存储位置Hive 存储在 HDFS 。数据库将数据保存在块设备或者本地文件系统中。2)数据更新Hive中不建议对数据的改写。而数据库中的数据通常是需要经常进行修改的,3)执行延迟Hive 执行延迟较高。数据库的执行延迟较低。当然,这个是有条件的,即数据规模较小,当数据规模大到超过数据库的处理能力的时候,Hive的并行计算显然能体现出优势。4)数据规模Hive支持很大规模的数据计算;数.原创 2021-08-08 19:52:23 · 686 阅读 · 4 评论