我要去桂林---田春峰的网志

快乐比成功更重要

田春峰ID:accesine960
725500次访问,排名44好友16人,关注者77
请用一段话来描述您自己,如性格、爱好、生活态度、工作情况、受教育状况等。让大家更了解你,不要超过1000个汉字
accesine960的文章
原创 245 篇
翻译 10 篇
转载 33 篇
评论 540 篇
田春峰的公告

天天多么乐

田春峰

accesine's Rapleaf Score

关于我的信息链接

Donews Blog

Subscribe with Bloglines

my qq number
最近评论
wangzepen:http://www.zzGps.cn 在线技术视频

http://bbs.ZzGps.Cn 技术视频下载

技术视频提供,分类清晰,技术覆盖面广,几千视频助您轻松学习
哈哈:我下载了,很不错,但是提示说什么是试用版的,请先激活后使用,怎么激火呢?
czdvcc:wow power leveling
soufang:看看搜房的搜索引擎
陈帮铭:顺便向此博客主人表示歉意,没有经过您的允许在您博客里发了一个招聘广告。希望敬请谅解。如果有机会的话非常希望能与您成为朋友可以互相交流一下。:)
文章分类
收藏
相册
Computer Pic
domolo
life
lucene
MsnRobot DingDang
searchengine
search-engine
seo
个人信息
其他
.net
C++
os
sp
工作流
开发工具
名人连接
数据库相关
搜索引擎
网络开发
我的好朋友
移动开发
组件
存档
软件项目交易
订阅我的博客
XML聚合  FeedSky
订阅到鲜果
订阅到Google
订阅到抓虾
订阅到BlogLines
订阅到Yahoo
订阅到GouGou
订阅到飞鸽
订阅到Rojo
订阅到newsgator
订阅到netvibes

原创 Hadoop Hbase适合存储哪类数据?收藏

新一篇: My Twitter[置顶]

Hadoop Hbase适合存储哪类数据?

        最适合使用Hbase存储的数据是非常稀疏的数据(非结构化或者半结构化的数据)。Hbase之所以擅长存储这类数据,是因为Hbase是column-oriented列导向的存储机制,而我们熟知的RDBMS都是
row- oriented行导向的存储机制(郁闷的是我看过N本关于关系数据库的介绍从来没有提到过row- oriented行导向存储这个概念)。在列导向的存储机制下对于Null值得存储是不占用任何空间的。比如,如果某个表 UserTable有10列,但在存储时只有一列有数据,那么其他空值的9列是不占用存储空间的(普通的数据库MySql是如何占用存储空间的呢?)。

        Hbase适合存储非结构化的稀疏数据的另一原因是他对列集合 column families 处理机制。 打个比方,ruby和python这样的动态语言和c++、java类的编译语言有什么不同? 对于我来说,最显然的不同就是你不需要为变量预先指定一个类型。Ok ,现在Hbase为未来的DBA也带来了这个激动人心的特性,你只需要告诉你的数据存储到Hbase的那个column families 就可以了,不需要指定它的具体类型:char,varchar,int,tinyint,text等等。

        Hbase还有很多特性,比如不支持join查询,但你存储时可以用:parent-child tuple 的方式来变相解决。
        由于它是Google BigTable的 Java 实现,你可以参考一下:google bigtable
        下面3副图是Hbase的架构、数据模型和一个表格例子,你也可以从:Hadoop summit
获取更多的信息。












发表于 @ 2008年04月27日 22:37:00|评论(loading...)|编辑

旧一篇: 不选择使用Lucene的6大原因

评论

#zwl 发表于2008-04-30 09:44:31  IP: 220.166.177.*
好!
#Hadoop Master 发表于2008-05-01 02:43:19  IP: 123.103.29.*
"""Ok ,现在Hbase为未来的DBA也带来了这个激动人心的特性,你只需要告诉你的数据存储到Hbase的那个column families 就可以了,不需要指定它的具体类型:char,varchar,int,tinyint,text等等"""

可定数据类型是数据库的高级特性, Hbase 无法支持这个“特性”就激动人心, 这很新鲜?这也叫特性?! 还是传统数据库系统支持数据类型是一种愚蠢的行为?那 Cxx 也不要数据类型好了

您的说法就好像是: 哇! Python 不支持强类型,编程语言又迈向了新的台阶,此举又将带来语言革命云云。。原来没有数据类型才是未来的趋势

哈哈
发表评论  


登录
Csdn Blog version 3.1a
Copyright © 田春峰