最近在研究hbase,今天要在公司里对hbase做简要介绍,写了一篇ppt。下面整理一下我的演讲思路
定位:由于这次演讲是针对普通程序员和nosql相关程序员两个群体同时进行,那么需要兼顾演讲的易理解性,以及部分技术深度。
我的思路如下:
1、 基于hdfs,继承了可靠性、高性能、可伸缩性。自己又有特点:列存储,实时读写,是一个数据库。
2、 数据库系统并不是孤立的,有必要介绍一下他在整个hadoop体系中的位置
3、 举例子方便大家理解:mysql-ntfs约=hbase-hdfs
4、 Mapreduce功能很强大,是hadoop和hbase都能用到的分析算法,以后介绍
5、 节点机的数量能够对表进行支撑。行列数据库比较
6、 Hbase表的逻辑结构(简单介绍一下timestamp概念)
7、 看了hbase表,那么我们来了解一下他在存储上市如何实现的
8、 每条记录,按key排序。举bigtable论文中CNN链接的例子
9、 表会切分成region。
10、为什么拆分:region->region server
11、 Region的结构:先不看其他,先看storeFile
12、 看完了物理存储,再来看架构:4种角色的机器,zookeeper是集群同步工具
13、 Region定位->三级索引
14、 表的一次写过程:WAL,memstore,flush
15、 4亿条数据快速定位查询示例
16、 Hbase的使用,简单的建表,查询语句
下载地址:http://download.csdn.net/download/kirayuan/5430349