--- 面试题总结
文章平均质量分 83
详细汇总,share
数据指北Ai
知名国企开发工程师,目前大数据和后端开发,致力全栈。欢迎交流!!!
展开
-
大数据面试题V1.0
简洁易懂的面试题,方便快速记忆。原创 2022-06-16 11:20:04 · 387 阅读 · 0 评论 -
Java基础+集合+多线程+JVM 面试题总结
大家好,我是脚丫先生 (o^^o)最近系统的总结了前辈们的各种面试题,站在巨人们的肩膀上真是看得远,我想只有对前辈们的知识进行自我的优化与吸收,才能形成适合自己的一份笔记。文章目录一、 Java 基础1.1 面向对象和面向过程的区别1.2 Java 语⾔有哪些特点?1.3 关于 JVM JDK 和 JRE 最详细通俗的1.3.1 JVM1.3.2 JDK 和 JRE1.4 Java 和 C++的区别?1.5 字符型常量和字符串常量的区别?1.6 构造器 Constructor 是否可被原创 2021-09-23 15:18:12 · 634 阅读 · 2 评论 -
Hive面试题总结
文章目录前言一、Hive1. Hive 表关联查询,如何解决数据倾斜的问题?2. 谈一下 Hive 的特点,Hive 和 RDBMS 有什么异同3. 请说明 hive 中 Sort By,Order By,Cluster By,Distrbute By各代表什么意思4. Hive 有哪些方式保存元数据,各有哪些特点5. Hive 内部表和外部表的区别6. Hive 的 HSQL 转换为 MapReduce 的过程7. Hive 中的压缩格式TextFile、SequenceFile、RCfile 、ORCfil原创 2021-03-30 11:57:21 · 1091 阅读 · 2 评论 -
hadoop面试题总结
文章目录前言一、基础二、使用步骤1.引入库2.读入数据总结前言根据参考的各大面试题进行总结,并且不断更新。希望能帮助大家一、基础简述hadoop安装1)使用 root 账户登录2)修改 IP3)修改 host 主机名4)配置 SSH 免密码登录5)关闭防火墙6)安装 JDK7)解压 hadoop 安装包8)配置 hadoop 的核心文件 hadoop-env.sh,core-site.xml , mapred-site.xml ,hdfs-site.xml9)配置 hado原创 2021-03-21 20:58:07 · 850 阅读 · 2 评论 -
spark相关面试题总结
(根据博客总结并不断增加自己的内容)1.spark中的RDD是什么,有哪些特性?答:RDD(Resilient Distributed Dataset)叫做分布式数据集,是spark中最基本的数据抽象,它代表一个不可变,可分区,里面的元素可以并行计算的集合Dataset:就是一个集合,用于存放数据的Destributed:分布式,可以并行在集群计算Resilient:表示弹性的...原创 2018-09-26 13:51:45 · 5966 阅读 · 0 评论 -
Flume面试题
1.Flume 采集数据会丢失吗?不会,Channel 存储可以存储在 File 中,数据传输自身有事务。2.Flume 与 Kafka 的选取?采集层主要可以使用 Flume、Kafka 两种技术。Flume:Flume 是管道流方式,提供了很多的默认实现,让用户通过参数部署,及扩展 API。Kafka:Kafka 是一个可持久化的分布式的消息队列。Kafka 是一个非常通用的...原创 2019-04-04 13:10:22 · 13307 阅读 · 0 评论 -
Kafka面试题
1.请说明什么是传统的消息传递方法?传统的消息传递方法包括两种:排队:在队列中,一组用户可以从服务器中读取消息,每条消息都发送给其中一个人。发布-订阅:在这个模型中,消息被广播给所有的用户。2.请说明 Kafka 相对于传统的消息传递方法有什么优势?高性能:单一的 Kafka 代理可以处理成千上万的客户端,每秒处理数兆字节的读写操作,Kafka 性能远超过传统的 Active...原创 2019-04-04 13:33:09 · 1869 阅读 · 0 评论 -
HBase面试题
0.Hbase是什么?(1) Hbase一个分布式的基于列式存储的数据库,基于Hadoop的hdfs存储,zookeeper进行管理。(2) Hbase适合存储半结构化或非结构化数据,对于数据结构字段不够确定或者杂乱无章很难按一个概念去抽取的数据。(3) Hbase为null的记录不会被存储.(4)基于的表包含rowkey,时间戳,和列族。新写入数据时,时间戳更新,同时可以查询到以前的版...原创 2019-04-04 22:05:34 · 27050 阅读 · 3 评论 -
Zookeeper面试题
1.ZooKeeper投票机制?本博客2.客户端对 ZooKeeper 的 ServerList 的轮询机制?随机,客户端在初始化的过程中,将所有 Server 保存在一个 List 中,然后随机打散,形成一个环。之后从 0 号位开始一个一个使用。3.一个客户端修改了某个节点的数据,其他客户端能够马上获取到这个最新数据吗?ZooKeeper 不能确保任何客户端能够获取(即 Re...原创 2019-04-03 17:58:32 · 4027 阅读 · 0 评论