面试
文章平均质量分 88
BoomLee
boomlee.com ,大数据开发的百宝箱。RHCE认证,AWS SAP 认证,大数据工程师,从事医疗大数据行业
展开
-
HDFS 面试篇(超全超详细) 欢迎补充
HDFS 简介HDFS (全称:Hadoop Distribute File System,Hadoop 分布式文件系统)是 Hadoop 核心组成,是分布式存储服务。分布式文件系统横跨多台计算机,在大数据时代有着广泛的应用前景,它们为存储和处理超大规模数据提供所需的扩展能力。HDFS是分布式文件系统中的一种。Hdfs的block和spark的partition有什么区别吗?1.在hdfs中的block是分布式存储的最小单元,等分,并且可以设置冗余,这样设计会出现一部分磁盘空间的浪费,但是整齐原创 2020-12-03 16:48:17 · 625 阅读 · 0 评论 -
2020 Flink 面试题(不定时更新,欢迎补充)
###简单介绍一下FlinkFlink 是一个框架和分布式处理引擎,用于对无界和有界数据流进行有状态计算。 并且 Flink 提供了数据分布、容错机制以及资源管理等核心功能。Flink提供了诸多高抽象层的API以便用户编写分布式任务: DataSet API, 对静态数据进行批处理操作,将静态数据抽象成分布式的数据集,用户可以方便地使用Flink提供的各种操作符对分布式数据集进行处...原创 2020-04-23 13:51:18 · 2606 阅读 · 0 评论 -
大数据之 HIVE 面试题 (不定时更新)
Hive 面试题 最全原创 2020-04-10 00:03:34 · 1754 阅读 · 0 评论 -
大数据之Spark面试题(不定时更新,欢迎补充)
1.spark中的RDD是什么,有哪些特性?RDD(Resilient Distributed Dataset)叫做分布式数据集,是spark中最基本的数据抽象,它代表一个不可变,可分区,里面的元素可以并行计算的集合。三个特性分区,不可变,并行操作。Resilient:表示弹性的,弹性表示 Destributed:分布式,可以并行在集群计算 Dataset:就是一个集合,用于存放...原创 2020-04-09 00:13:25 · 635 阅读 · 0 评论 -
一分钟了解悲观锁和乐观锁
何谓悲观锁与乐观锁悲观锁乐观锁应用场景版本号机制CAS 算法乐观锁的缺点1. ABA 问题2. 循环时间长开销大3.只能保证一个共享变量的原子操作CAS与synchronized的使用情景乐观锁对应于生活中乐观的人总是想着事情往好的方向发展,悲观锁对应于生活中悲观的人总是想着事情往坏的方向发展。这两种人各有优缺点,不能不以场景而定说一种人好于另外一种人。悲观锁总是假设最坏的情况,每次去拿...原创 2020-04-08 23:16:52 · 501 阅读 · 0 评论