![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
大数据面试
文章平均质量分 90
kk_io
这个作者很懒,什么都没留下…
展开
-
Flink如何保证数据的一致性
当在分布式系统中引入状态时,自然也引入了一致性问题。一致性实际上是"正确性级别"的另一种说法,也就是说在成功处理故障并恢复之后得到的结果,与没有发生任何故障时得到的结果相比,前者到底有多正确?举例来说,假设要对最近一小时登录的用户计数。在系统经历故障之后,计数结果是多少?如果有偏差,是有漏掉的计数还是重复计数?原创 2022-01-03 10:25:27 · 1496 阅读 · 1 评论 -
滴滴面试题(2018.10.27) HBase资深工程师
第一个面试官: 介绍项目? HBase的架构? HBase的读写的整个流程? HBase的主键设计? 对Phoenix有什么优化? hive的分区表,hive的分桶表,有什么区别? zookeeper的数据结构? zookeeper如何实现的数据一致性? 如果需要你去实现zookeeper的数据一致性,你会如何去...原创 2018-11-01 19:45:30 · 389 阅读 · 0 评论 -
2018年面试大数据面试数据结构总结
目录数据结构的定义数据结构的分类逻辑结构分类物理结构分类相关概念时间复杂度hashhash冲突Java中的数组结构线性表ArrayListLinkedList链表Java中的实现Vector栈和队列栈在Java中的应用JDK1.7中HashMap的实现哈希表HashtableHashMap树平衡二叉树的创建...原创 2018-11-08 16:38:29 · 718 阅读 · 0 评论 -
百度面试题(2018.10.29) 内容生态事业部
介绍自己的项目 项目的数据量有多大 zookeeper在follower死掉后,如何重新选举? hdfs的数据存储和读取过程? hdfs在数据存储过程中,如何保证副本的数据一致性? 当时我没想起来,于是被问道,如果是你设计,你会如何实现hdfs数据写入的一致性? 如果hdfs在所有副本都把数据都写入完了,再记录元数据信息,会不会很慢?...原创 2018-11-01 19:40:11 · 381 阅读 · 0 评论