- 博客(7)
- 资源 (22)
- 收藏
- 关注
原创 HBase学习笔记——基本操作:shell和java API
进入HBase shell的命令:./hbase shellHBase的基本操作如下表所示 一、创建表1、shell操作相关shell操作如下所示:显示HBase中的所有表 创建表(指定命名空间、包含列族c1) 创建表(默认命名空间、包含列族c1和c2) 2、Java APIConfiguration conf = HBaseConfiguration.create();HBaseAdmin
2017-02-22 16:41:14 961 1
原创 HBase学习笔记——命名空间(namespace)
在关系数据库系统中,命名空间namespace指的是一个表的逻辑分组,同一组中的表有类似的用途。命名空间的概念为即将到来的多租户特性打下基础:配额管理(Quota Management (HBASE-8410)):限制一个namespace可以使用的资源,资源包括region和table等;命名空间安全管理(Namespace Security Administration (HBASE-920
2017-02-22 16:15:42 20891 2
原创 HBase学习笔记——关键算法/流程
一、Region定位系统如何找到某个行健(或者某个行健范围)所在的Region?HBase 中有两张特殊的表:-ROOT-和.META. .META.:记录了用户表的Region 信息,.META.可以有多个regoin -ROOT-:记录了.META.表的Region 信息,-ROOT-只有一个region Zookeeper 中记录了-ROOT-表的location Cl
2017-02-21 21:50:21 740
原创 HBase学习笔记——系统架构
可以看到,Client访问HBase上数据的过程并不需要Master参与(寻址访问Zookeeper和Region Server,数据读写访问Regione Server),Master仅仅维护者table和region的元数据信息,负载很低。一、Client包含访问hbase的接口,client维护着一些cache来加快对HBase的访问,比如Regione的位置信息。二、Zookeeper保证
2017-02-21 21:17:44 495
原创 HBase学习笔记——物理模型
一、HRegionHBase中表在行的方向上分割为多个Hregion。 HRegion按大小分割的,每个表一开始只有一个region,随着数据不断插入表,HRegion不断增大,当增大到一个阀值的时候,HRegion就会等分会两个新的HRegion,当table中的行不断增多,就会有越来越多的Hregion。 HRegion是HBase中分布式存储和负载均衡的最小单元。最小单元就表示不同的HReg
2017-02-21 21:00:00 2255
原创 HBase学习笔记——逻辑视图
本文章将主要讲解HBase的逻辑视图,首先给出逻辑视图的一个例子,之后进行详细的介绍。HBase以表的形式存储数据,表由行和列组成,列划分为若干个列族,每个列族可以有多个列。一、行健(row key)与NoSQL数据库一样,行健是用来检索记录的主键,行健就像RDBMS中的主键。访问hbase table中的行,只有三种方式:1、通过单个row key访问。2、通过row key的range。3、
2017-02-21 20:22:03 2072
原创 HBase学习笔记——入门简介
一、HBase是什么?HBase是一种构建在HDFS之上的分布式、面向列的和提供高可靠性、高性能、列存储、可伸缩、实时读写的开源数据库系统,在需要实时读写、随机访问超大规模数据集时,可以使用HBase。HBase是Apache的Hadoop项目的子项目,该技术来源于 Fay Chang 所撰写的Google论文"Bigtable:一个结构化数据的分布式存储系统"。HBase 是Bigtable 的
2017-02-21 19:42:14 574
BeerAdvocate--Preprocess
2018-03-02
BeerAdvocate--Source
2018-03-02
Citysearch Corpus
2018-03-02
NLPCC2012评估任务_面向中文微博的情感分析
2018-01-21
NLPCC2013评估任务_跨领域情感分类
2018-01-21
NLPCC2013评估任务_中文微博情绪识别
2018-01-21
NLPCC2013评估任务_中文微博观点要素抽取
2018-01-21
NLPCC2014评估任务2_基于深度学习的情感分类
2018-01-21
MPQA(Multiple-Perspective QA)
2018-01-20
康奈尔影评数据集
2018-01-20
知网主张词语词典
2018-01-20
知网程度级别词语词典
2018-01-20
台湾大学中文情感极性词典
2018-01-20
大连理工大学情感词汇本体库(无辅助情感分类)
2018-01-20
SemEval-2014 Task 4数据集
2018-01-20
中文停用词列表
2017-10-22
谭松波-酒店评论语料-UTF-8,10000条
2017-04-19
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人