![](https://img-blog.csdnimg.cn/20201014180756918.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
大数据面试总结
文章平均质量分 68
新手小农
这个作者很懒,什么都没留下…
展开
-
大数据面试 --- 六
对于注入时间,是进入Flink中的事件,后续一般会都会使用该时间,一般不需要结合水位线生成,所以不能处理无序事件和延迟数据。对于事件时间,在进入Flink之前就已经存在了,必须要结合水位线进行生成,在处理无序事件会有一定的延迟。对于摄入时间,指的是执行操作算子的系统时间,每一个算子的时间不同,所以性能相对较高。事件时间指的是事件产生的时间,通常使用事件中的时间戳来描述。摄入时间指的是事件在Flink中被处理的当前时间。注入时间指的是时间进入Flink中的事件。原创 2024-05-15 14:10:26 · 183 阅读 · 0 评论 -
大数据面试专题 -- kafka
是一个用于存放数据的组件,用于系统之间或者是模块之间的消息传递。kafka是一种基于订阅发布模式的高性能,高吞吐的实时的消息队列,是一个分布式系统,高性能的TCP网络协议进行的。AR:所有的副本ISR:健康的副本OSR:有问题的副本。原创 2024-03-30 17:16:46 · 1142 阅读 · 1 评论 -
大数据面试总结 五
clickhouse是列式存储关系里系统,专门用于高性能数据分析和数据仓库应用。是一个开源的数据库系统。原创 2024-03-20 11:59:19 · 107 阅读 · 0 评论 -
大数据面试总结 四
每一个datanode都会定期向namenode发送heardbeat消息,当一段时间namenode没有接收到某一个datanode的消息,此时namenode就会将该datanode标记为死亡,并不会向他们发送任何的IO请求,同时任何注册到失效的namenode上的数据不会提供给hdfs所使用,当某些块的副本数小于指定的数量的时候,namenode会不断的跟踪哪些副本是需要复制的,并在必要的时候进行复制。insert into 表名 (列名1,列名2,列名3)values(值1,值2,值3)原创 2024-03-20 11:57:38 · 1121 阅读 · 0 评论 -
大数据面试总结三
mysql中的索引是一种数据结构,创建索引的目的是为了加快查询的效率。原创 2024-02-23 22:04:01 · 691 阅读 · 0 评论 -
大数据面试总结 二
就是将维度表退化到事实表中,例如说一个订单表,是一个事实表,还有一个就是商品的信息表,是维度表,将来进行展示的时候,需要展示的商品的所有的信息,就类似于join,将维度表关联到事实表中。主要存放的就是一些不怎么变化的数据表,就比如说一些地域的省份的名称就不会发生改变。原创 2023-12-10 20:27:42 · 1107 阅读 · 0 评论 -
大数据面试总结
ptuval()的核心就是通过哈希码来定位同桶,然后向桶中插入数据,如果桶是空的,那么就直接向桶中插入新的节点,如果桶不是空的,就会遍历红黑树,判断key是否存在,如果存在,那个原先旧的value就会被新的value所代替。会根据需要查询的key通过哈希算法计算出哈希码,通过哈希码来确定对应的桶的位置,如果桶是空的,那么就返回null,值不存在,如果桶不是空的,就遍历链表或者是红黑树,通过equals()方法来比较传入的键与当前的键是否相同。默认扩容后的数据的容量的大小是等于原先旧的2的n倍。原创 2023-12-05 22:43:45 · 1849 阅读 · 0 评论