文章目录
一、HBase概述
(一)从BigTable说起
BigTable是一个分布式存储系统,BigTable起初用于解决典型的互联网搜索问题。
1、爬虫持续不断地抓取新页面,这些页面每页一行地存储到BigTable里
2、MapReduce计算作业运行在整张表上,生成索引,为网络搜索应用做准备
3、用户发起网络搜索请求
4、网络搜索应用查询建立好的索引,从BigTable得到网页
5、搜索结果提交给用户
- 利用谷歌MapReduce分布式并行计算模型来处理海量数据
- 使用谷歌分布式文件系统GFS作为底层数据存储
- 采用Chubby提供协同服务管理
- 可以扩展到PB级别的数据和上千台机器,具备广泛应用性、可扩展性、高性能和高可用性等特点
- 谷歌许多项目都存储在BigTable中,包括搜索、地图、财经、打印、社交网站Orkut、视频共享网站YouTube和博客网站Blogger等
(二)HBase简介
1、HBase是什么
HBase是一个高可靠、高性能、面向列、可伸缩的分布式数据库,是