HBase的简介和成功案例

HBase概述

1.HBase介绍

HBase是一种数据库:hadoop分布式数据库。

是一个随机访问存储和检索数据的平台。

HBase不做用于处理实时数据,适合处理海量数据

2.HBase背景

关系型数据库(RDBMS) :mysql ,oracle ,db2 , sqlserver

联机式事务处理(OLTP)系统使用RDBMS,来实时记录交易信息。

OLAP系统用来分析查询存储数据(大学主要要使用) 按天,按周,按月,按季度,按年 从不同角度分析信息。

NoSql :Not only sql。大数据的发展催生

HBase是BIGtable 上的开源java版本 建立在HDFS基础之上。

3.使用场景和部分成功案例

BigTable发明的原因 :早期互联网的搜索问题

互联网(1)——>爬虫(2)——>HBase(会建立很多的索引文件)——>HBase的web搜索(3)

通过MapReduce 程序拿索引文件,HBase返回数据给搜索栏最后返回给用户

用户 (5)<——>浏览器的搜索栏等<——索引文件(4)(HBase可以拿到)

搜索互联网

用户法欺网络搜索请求,网络搜索应用查询和建立好的索引直接从HBase得到匹配的数据,搜索的数据结果提交给用户。

为什么要建立互联网索引?

1.爬虫持续不断的从互联网爬取新页面,这些页面每页一行存储到HBase里面。

2.通过MapReduce计算运行到整张表上,生成索引,用户查询可以速度更快。

示例图
在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值