1、初识Hbase
· 稀疏、分布式、持久化 ,KV存储,随机访问随机存储的平台
· 无关系性数据库那样的模式,无sql,无跨行事务,不强调数据之间的关系
· 集群运行,也可以单台机器,横向扩展能力强,存储、缓存、计算能力多台机器提供
2、说说传统数据库
不可否认,传统关系型数据库在数据存储、服务和处理上的巨大成功,sql server,oralce,mysql,DB2等,传统的数据库主要有两种类型
· 联机事务处理(OLTP):实时记录交易信息,如银行的OLTP系统,超市的收银机系统
· 联机分析处理(OLAP):分析和查询所存储的系统,按天、周或者月形成报表统计分析。
主要的公司:oralce,微软,Vertica,Teradata等,
· 关系算法决定了关系数据库的特征,都需要预先定义模式和数据要遵守数据类型,使用sql的方式可以处理一切,现实中还有一部分场景都适合使用关系型数据库。
数据库知识网站DB-engines.com更新的2015年12月份前20名榜单
3、大数据时代
概念理解:4V,数据量大(volume)、数据类型多(variety)、价值高(value)、处理速度快(volicty)
价值理念:从数据统计分析 ->数据价值挖掘,从抽样统计- >全量计算
数据驱动商业价值
4、Google IT 创新的引领者
美国的创新公司较多:Goolge、雅虎、FaceBook等,中国的IT巨头则很多是山寨高手XX讯、XX米等等,
谷歌的三篇论文:GFS(分布式系统)、Map Reduce(分布式计算框架)、BigTable(KV存储)
GFS导致了Hadoop的产生和风靡
BigTable则产生了Hbase, 分类到NoSql阵营
5、Hbase横空出世
Hadoop和Hbase之父:goolge的三大论文发布后,Doug Cutting和Mike Cafarella做了进一步实现,hadoop来源于他们的Nutch项目,后来Doug跳槽到Yahoo,hadoop进一步发展成一个顶级项目,2007年,Mike Cafarella后来发布了其实验性开源代码Hbase。
有些人学Java几年 写的都是hello world级别的代码,有些大神则写的hadoop级别的代码,既有天赋,也有勤奋,永远保持学无止境的心态做一件事情。
6、Hbase使用场景
关系型数据库能用的场景Hbase都能用(不考虑事务处理),关系型数据库不能用的Hbase也能用
* 互联网搜索问题:google等互联网公司海量数据的检索
* 当作数据库存储数据
用的最多的场景是海量数据的快速写入和检索,如大型的互联网公司、通信运营商、金融领域等等
本文为Anmy老师原创,感兴趣的欢迎转载
格言:码代码的同时,努力成为一个知识的传播者。
QQ: 1726076126