数据应用面试
文章平均质量分 85
TaiKuLaHa
这个作者很懒,什么都没留下…
展开
-
【面试】Hbase
命名空间,类似于概念,每个命名空间下有多个表。Hbase有两个自带的命名空间,分别是hbase和default, hbase中存放的是HBase内置的表, default表是用户默认使用的命名空间。原创 2023-07-09 23:18:51 · 861 阅读 · 0 评论 -
【面试】Java并发编程
hreadLocalMap使用ThreadLocal的弱引用作为key,如果一个ThreadLocal不存在外部强引用时,Key(ThreadLocal)势必会被GC回收,这样就会导致ThreadLocalMap中key为null, 而value还存在着强引用,只有thead线程退出以后,value的强引用链条才会断掉。但如果当前线程再迟迟不结束的话,这些key为null的Entry的value就会一直存在一条强引用链:永远无法回收,造成内存泄漏。原创 2023-06-18 19:53:16 · 1586 阅读 · 0 评论 -
【面试】Mysql
『浅入深出』MySQL 中事务的实现原创 2023-06-21 17:41:25 · 1171 阅读 · 0 评论 -
【面试】数据仓库
维度建模以分析决策的需求出发构建模型,构建的数据模型为分析需求(也就是我们通常所说的数据分析)服务。它重点解决如何更快速完成分析需求,同时还有较好的大规模复杂查询的响应性能。维度表中包含事实表中记录的特性,有些特性提供了描述性信息,有些特性指定如何汇总事实表中的数据,以便未分析者提供有用的信息。事实表是指保存了大量业务度量数据的表,事实表中的度量一般称为实施。粒度是指数据仓库的数据单位中,保存数据细化程度的级别。(0) 什么是维度建模?(1) 事实表与事实表。(2) 维度与维度表。原创 2023-06-26 22:56:03 · 864 阅读 · 0 评论 -
【面试】Spark
stage的划分依据就是看是否产生了shuflle(即宽依赖),遇到一个shuffle操作就划分为前后两 个stage。spark job是根据action算子触发的,遇到action算子就会起一个job。它是 stage 的子集,以分区数来衡量,分区数多少,task 就有多少。spark-submit 提交的一个spark任务。原创 2023-06-28 11:49:04 · 766 阅读 · 0 评论