第六课记录 Hadoop的起源——Google的基本思想之二

主题:Hadoop高可用性(HA)的原理和实现
1、什么是HA?: 防止主节点死掉了,造成整个集群无法访问
2、ZooKeeper简介
3、Hadoop高可用性的实现原理
4、Demo演示:Hadoop的HA




HA两方面:HDFS和Yarn  ----> Hadoop平台
        HBase

                Storm


一、上次公开课内容回顾




二、Google的基本思想之二:MapReduce计算模型   来源就是:PageRank   ----> 数据的计算
        1、什么是PageRank问题?----> 搜索排名
        2、PageRank:网页1亿个-----> MapReduce计算模型
        3、更简单一点的例子:MapReduce计算模型
        4、思考问题:MapReduce最大的问题是什么?  ----> Spark计算模型


三、Google的基本思想之三:BigTable(大表)  -----> NoSQL数据库:HBase
        1、大表是违背关系型数据库范式的要求
        2、关系型数据库:设计表结构
                (1)遵从ER模型 ---> 范式 ---> 外键 : 好处:减少数据冗余   坏处:影响性能(多表查询)
                (2)为了提高性能:创建一些冗余表(提高性能)

        3、BigTable(大表):类似冗余表。通过牺牲空间,换取性能























  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值