面试
文章平均质量分 88
猿来如此dj
目前西安工作-航天宏图公司大数据开发工程师,欢迎大家交流。
展开
-
java原理1:java多线程
多线程1:基本概念串行:一个线程执行到底,相当于单线程。并发:多个线程交替执行,抢占cpu的时间片,但是速度很快,在宏观角度看来就像是多个线程同时执行。并行:多个线程在不同的cpu中同时执行。1.1:多线程的实现1、继承Thread类: 步骤:①、定义类继承Thread; ②、复写Thread类中的run方法; 目的:将自定义代码存储在run方法,.........原创 2020-07-15 17:56:52 · 508 阅读 · 0 评论 -
java基本面试题汇总
乐观锁:乐观锁认为竞争不总是会发生,因此它不需要持有锁,将比较-替换这两个动作作为一个原子操作尝试去修改内存中的变量,如果失败则表示发生冲突,那么就应该有相应的重试逻辑。悲观锁:悲观锁认为竞争总是会发生,因此每次对某资源进行操作时,都会持有一个独占的锁,就像synchronized,不管三七二十一,直接上了锁就操作资源了。原创 2021-11-23 20:55:05 · 188 阅读 · 0 评论 -
sql面试问题汇总
1:sql中delete,drop,truncate区别。原创 2022-11-04 11:29:17 · 411 阅读 · 0 评论 -
(二)hadoop面试
Hadoop是一个由Apache基金会所开发的分布式系统基础架构, 是一个存储系统+计算框架的软件框架。主要解决海量数据存储与计算的问题,是大数据技术中的基石。Hadoop以一种可靠、高效、可伸缩的方式进行数据处理,用户可以在不了解分布式底层细节的情况下,开发分布式程序,用户可以轻松地在Hadoop上开发和运行处理海量数据的应用程序。原创 2023-01-14 10:50:28 · 1040 阅读 · 0 评论 -
(十)hive面试指南
自定义UDF:继承UDF,重写evaluate方法自定义UDTF:继承GenericUDTF,重写3个方法,initialize(自定义输出的列名和类型),process(将结果返回forward(result)),close。原创 2022-11-21 16:55:39 · 158 阅读 · 0 评论 -
(九)kafka面试问题汇总
kafka面试问题汇总1:kafka的配置如何数据盘:6块8T的数据盘,由12块raid1组成。内存256G。2:kafka的吞吐量为什么高包括生产者和消费者两面优势2.1生产者方面1:顺序读写topic以分区partition存放,每条消息都有一个偏移量,每个partition是一个文件存放在硬盘上。所以写入时消息是根据偏移量不断追加到文件中的。不需要硬盘磁头的寻道时间,所以速度远快于随机读写,甚至和内存读写媲美。缺点就是不允许删除消息。所以为了避免存储压力:Kakfa提供了两种策略来删原创 2020-07-15 17:55:33 · 294 阅读 · 0 评论 -
hbase面试
1:hbase架构Client 包含了访问 HBase 的接口,另外 Client 还维护了对应的 Cache 来加速 HBase 的访问,比如 Cache 的.META.元数据的信息。HMaster:HBase 的主节点,负责整个集群的状态感知、Region server的负载均衡、region分配,管理用户对table的增删改操作。HMaster 负载压力相对于 HDFS 的 NameNode会小很多。HBase 的 HMaster 其实就算是宕机一段时间也可以正常对外提供服务的Regi原创 2021-04-12 19:09:28 · 213 阅读 · 0 评论 -
spark面试
spark面试1:spark的算子和广播变量算子分为Transformations转换和action行动两种算子转换算子是懒加载的记录算子的操作记录只有行动算子才会触发执行,主要包括,filter,map等操作,action算子主要包括reducebykey,foreach,print等算子,会触发真正的执行动作,只有转换算子程序会报错。广播变量:在driver端定义的变量会分享到每个task任务。为了减小存储空间,可以使用广播变量到每个执行器executor,sc.broadcast进行定义,广播原创 2021-04-06 12:42:03 · 417 阅读 · 0 评论