大数据理论与实践I 一些习题

Q1 哈希取模在那些技术中使用过,分别发挥什么作用?

MapReduce – map任务将中间结果写入专用内存缓冲区buffer,同时进行partition。

Sqoop – 从Oracle或DB2导入数据时,利用哈希取模实现数据均匀分片。

Inceptor / Hive – 利用select…Distributeby…Sortby(Clusterby)实现数据分桶

Search / ElasticSearch – 将document分入不同的shard

Q2 ZooKeeper在哪些技术和产品中使用过?分别起什么作用?  【配置管理、集群管理、分布式锁】

HDFS – NameNode HA : Active NN选举。

YARN – ResourceManager HA : Active RM 选举、存储元数据。

Kafka:存储元数据;配置管理;broker动态扩展;broker负载均衡;controller leader选举; consumer group变化时的rebalance

Hyperbase – Hmaster选举、存储元数据入口地址。

So

  • 2
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值