通过hbase处理hdfs储存的原始数据,根据明确的用户需求对hdfs中的数据进行二次处理,然后后进行储存和添加索引,便于用户查看
具体实现:
Hbase所创建的表的结构是固定的,表由行键、列族、列族中的具体的列组成
因为任务调度有周期间隔,故其无法做到真正的实时查询
所以hbase中的每条数据来自每次mapreduce的处理结果
所以hbase添加数据的方式就是在每次的mapreduce时,如果有hbase需要的数据,就添加进来
读取数据:web借口通过调用hbase的api中的scan方法进行读取即可