JavaMan_chen的专栏

不积跬步无以至千里,将知识持久化存储起来

HBase之Java API

1.Configuration 在使用Java API时,Client端需要知道HBase的配置环境,如存储地址,zookeeper等信息。这些信息通过Configuration对象来封装,可通过如下代码构建该对象         Configuration config=HBaseConfig...

2012-01-30 17:15:39

阅读数 19699

评论数 2

HBase之功能细节

1.Region定位 在Google的BigTable体系中,tablet的存储地址通过3层目录结构来定位的,如图所示: 注:tablet等同与HBase中的Region 图释说明: (1)METADATATable METADATATable是系统预定义的Table,当...

2012-01-14 11:49:44

阅读数 5132

评论数 2

HBase之体系结构(Architecture)

HBase在分布式部署上采用master/slave的方式,主要包含3大功能组件,分别是:RegionServer、MasterServer和ClientLibrary 在分布式存储上使用的是Hadoop的HDFS子框架 分布式计算功能基于Hadoop的MapReduce实现 1.Regio...

2012-01-13 09:02:20

阅读数 3898

评论数 0

HBase之数据模型(DataModel)

HBase基于Google的BigTable构建,是一种column-orientednosql数据库 1.模型视图 1.1概念视图 从概念模型上看,HBase的存储逻辑同关系数据库类似,是基于Table的存储,存储视图如图所示: 图中列出了表格的一条记录,com.cnn.www是...

2012-01-12 16:23:08

阅读数 4518

评论数 1

HBase集群搭建

一、安装环境: 至少两台linux主机,假设两台机器的登录用户名都为hbase,并且IP分配如下: 192.168.7.85         master机器 192.168.7.72         slave机器 集群的每台机器需要安装如下软件: 1.ubuntu linux 2....

2012-01-10 17:41:45

阅读数 9821

评论数 0

常用NoSQL比较

公司最近正在做NoSQL选型,通过一周的时间对几种常用的NoSQL做了以下粗略的分析和比较 名词解释: 分布式存储单元:在分布式存储中,通常要把比较大的数据文件切割成不同的块,以便放到不同的机器上分开存储,每一个分割块称之为一个存储单元。 一、CouchDB CouchDB是一种面向文...

2012-01-09 09:04:13

阅读数 4348

评论数 1

Nutch加Hadoop集群搭建

1、Apache Nutch    Apache Nutch是一个用于网络搜索的开源框架,它提供了我们运行自己的搜索引擎所需的全部工具,包括全文搜索和Web爬虫。 1.1、Nutch的组件结构 WebDB:存储网页数据和连接信息 Fetch lists:将WebDB所存储的连接分成多个...

2012-01-06 09:18:15

阅读数 6442

评论数 2

XPath和JCR-SQL2性能比较

最近,对jackrabbit中Xpath和JCR-SQL2的查询性能做了一下比较,虽然JCR从2.0版本开始不再推荐使用XPath,但从查询性能上来讲,XPath似乎远高于JCR-SQL2 以下是查询比较结果 测试环境:     Jackrabbit 2.2.7     操作系统   Wi...

2012-01-05 16:32:56

阅读数 4035

评论数 12

提示
确定要删除当前文章?
取消 删除