自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 HBase适合做BI分析的数据源吗?

HBase是建立Hadoop File System上的一层Key-Value Pair存储服务器。 HBase能够支持Key-Value快速插入,修改及删除,和单个Key到Value快速查询。那么Hbase适合做BI分析的数据源吗?筛选(Filtering)和聚合(Aggregation)是BI中的基本运算,所以我们首先要知道HBase是否能支持快速的筛选和聚合运算。 MapRedu

2013-01-11 19:33:55 3061

原创 大数据分析(Big Data OLAP)引擎Dremel, Tenzing 以及Impala

对于数据分析师来说,SQL是主要的语言。 Hive为Hadoop提供了支持SQL运行的能力,可是目前Hive运行速度达不到实时要求。这是因为Hive将SQL翻译成一个或多个MapReduce任务,而MapReduce原本是大数据批处理计算框架,并不适应实时数据分析的速度要求。 现在有两种思路去提高SQL在大数据平台上的执行速度:1.      用一种更快的SQL执行引擎取代MapRed

2012-12-25 20:12:28 5063 1

原创 从谷歌(google)到Hadoop,再到大数据商业智能(Big Data BI)

从Google到Hadoop谷歌(google)在成立公司的第一天起,就面对着大数据的问题。谷歌在大数据技术开发上,投入大量的资金和人才,其成就一直领先业界。谷歌对于核心技术也从不掩盖,积极在学术期刊上公开其大数据系统的最新进展,对业界,特别是开源社区(open source community), 起着指导作用。在过去十年里,一般是谷歌首先发表关于大数据技术的论文,然后开源社区的程序员研究并

2012-11-30 17:11:33 2572

原创 大数据(big data)究竟是什么?

“大数据”这个词最近两三年在IT界越来越热门,搞IT的如果嘴里不说起大数据,就好象是落了伍。大数据的意思不同人有不同的说法,比较实在含义是特指以Hadoop为代表的大型并发机群(Massively Parallel Processor)数据存储系统 。PB(1PB=1000TB)级在线数据(online data)存储在Hadoop里面,即被称作大数据。这几年,这个领域一直是个热门,即便在08,

2012-11-30 16:23:34 5283

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除