Hbase课程01- 和Anmy学习大数据

1、初识Hbase

       ·  稀疏、分布式、持久化 ,KV存储,随机访问随机存储的平台

       ·  无关系性数据库那样的模式,无sql,无跨行事务,不强调数据之间的关系

       ·  集群运行,也可以单台机器,横向扩展能力强,存储、缓存、计算能力多台机器提供

2、说说传统数据库

     不可否认,传统关系型数据库在数据存储、服务和处理上的巨大成功,sql server,oralce,mysql,DB2等,传统的数据库主要有两种类型

     · 联机事务处理(OLTP):实时记录交易信息,如银行的OLTP系统,超市的收银机系统

     · 联机分析处理(OLAP):分析和查询所存储的系统,按天、周或者月形成报表统计分析。

   主要的公司:oralce,微软,Vertica,Teradata等,

    · 关系算法决定了关系数据库的特征,都需要预先定义模式和数据要遵守数据类型,使用sql的方式可以处理一切,现实中还有一部分场景都适合使用关系型数据库。

数据库知识网站DB-engines.com更新的2015年12月份前20名榜单

                 


3、大数据时代

    概念理解:4V,数据量大(volume)、数据类型多(variety)、价值高(value)、处理速度快(volicty)

    价值理念:从数据统计分析 ->数据价值挖掘,从抽样统计- >全量计算

    数据驱动商业价值


4、Google  IT 创新的引领者

    美国的创新公司较多:Goolge、雅虎、FaceBook等,中国的IT巨头则很多是山寨高手XX讯、XX米等等,

    谷歌的三篇论文:GFS(分布式系统)、Map Reduce(分布式计算框架)、BigTable(KV存储)

     GFS导致了Hadoop的产生和风靡

     BigTable则产生了Hbase, 分类到NoSql阵营


5、Hbase横空出世

      Hadoop和Hbase之父:goolge的三大论文发布后,Doug Cutting和Mike Cafarella做了进一步实现,hadoop来源于他们的Nutch项目,后来Doug跳槽到Yahoo,hadoop进一步发展成一个顶级项目,2007年,Mike Cafarella后来发布了其实验性开源代码Hbase。

      有些人学Java几年 写的都是hello world级别的代码,有些大神则写的hadoop级别的代码,既有天赋,也有勤奋,永远保持学无止境的心态做一件事情。 



    6、Hbase使用场景

        关系型数据库能用的场景Hbase都能用(不考虑事务处理),关系型数据库不能用的Hbase也能用

         * 互联网搜索问题:google等互联网公司海量数据的检索

         * 当作数据库存储数据

        用的最多的场景是海量数据的快速写入和检索,如大型的互联网公司、通信运营商、金融领域等等


  

    本文为Anmy老师原创,感兴趣的欢迎转载

    格言:码代码的同时,努力成为一个知识的传播者。

    QQ:   1726076126

  

 














发布了34 篇原创文章 · 获赞 6 · 访问量 9万+
展开阅读全文

没有更多推荐了,返回首页

©️2019 CSDN 皮肤主题: 大白 设计师: CSDN官方博客

分享到微信朋友圈

×

扫一扫,手机浏览