自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

隔壁老杨的专栏

关注大数据,hadoop,hbase,spark,姑娘等相关话题

  • 博客(30)
  • 收藏
  • 关注

spark编译与onyarn的运行

Spark on yarn执行流程源代码分析 目前的分析主要基于spark0.9.0的cdh5的版本进行分析, 源代码下载地址:https://github.com/cloudera/spark.git 下载方式:git clone url ./spark 进入spark目录,执行git checkout cdh5-0.9.0_5.0.0   ...

2014-04-28 14:40:43 107

原创 spark编译与onyarn的运行

Spark on yarn执行流程源代码分析目前的分析主要基于spark0.9.0的cdh5的版本进行分析,源代码下载地址:https://github.com/cloudera/spark.git下载方式:gitclone url ./spark进入spark目录,执行gitcheckoutcdh5-0.9.0_5.0.0源代码编译使用sbt编译spa

2014-04-28 14:35:06 2227

UserScan的处理流程分析

UserScan的处理流程分析 前置说明 Userscan是通过client或cp中发起的scanner操作。 在Scan中通过caching属性来返回可以返回多少条数据,每次进行next时。 通过batch属性来设置每次在rs端每次next kv时,可读取多少个kv,(在同一行的情况下) 在生成Scan实例时,最好是把family与column都设...

2014-04-25 16:46:55 385

原创 UserScan的处理流程分析

UserScan的处理流程分析前置说明Userscan是通过client或cp中发起的scanner操作。在Scan中通过caching属性来返回可以返回多少条数据,每次进行next时。通过batch属性来设置每次在rs端每次nextkv时,可读取多少个kv,(在同一行的情况下)在生成Scan实例时,最好是把family与column都设置上,这样能保证查询的最高效.cli

2014-04-25 16:41:13 2065

Major compaction时的scan操作

Major compaction时的scan操作 发起major compaction时,通过CompactSplitThread.CompactionRunner.run开始执行  -->region.compact(compaction, store)-->store.compact(compaction)--> CompactionContex...

2014-04-24 16:14:38 164

原创 Major compaction时的scan操作

Major compaction时的scan操作发起majorcompaction时,通过CompactSplitThread.CompactionRunner.run开始执行-->region.compact(compaction,store)-->store.compact(compaction)-->CompactionContext.compact,发起compact操作C

2014-04-24 16:07:58 1512

minor compaction时的scan操作分析

minor compaction时的scan操作分析 minor compaction时的scan主要是对store下的几个storefile文件进行合并,通常不做数据删除操作。 compaction的发起通过CompactSplitThread.requestCompactionInternal-->  CompactSplitThread.Compacti...

2014-04-23 14:00:19 150

原创 minor compaction时的scan操作分析

minor compaction时的scan操作分析minor compaction时的scan主要是对store下的几个storefile文件进行合并,通常不做数据删除操作。compaction的发起通过CompactSplitThread.requestCompactionInternal-->CompactSplitThread.CompactionRunner.run-->re

2014-04-23 13:56:12 1428

compact处理流程分析

compact处理流程分析 compact的处理与split相同,由client端与flush时检查发起。 针对compact还有一个在rs生成时生成的CompactionChecker线程定期去检查是否需要做compact操作 线程执行的间隔时间通过hbase.server.thread.wakefrequency配置,默认为10*1000ms Compa...

2014-04-21 21:05:54 365

原创 compact处理流程分析

hbase0.96 compact处理流程分析

2014-04-21 20:56:39 2452

原创 region split流程分析

region split流程分析

2014-04-19 16:37:18 2424 2

region split流程分析

region split流程分析split region的发起主要通过client端调用regionserver.splitRegion或memstore.flsuh时检查并发起。 Client通过rpc调用regionserver的splitRegion方法client端通过HBaseAdmin.split传入region name与split point(切分的rowkey,...

2014-04-19 16:37:10 136

memstore的flush流程分析

memstore的flush流程分析memstore的flush发起主要从以下几个地方进行: a.在HRegionServer调用multi进行更新时,检查是否超过全局的memstore配置的最大值与最小值,   如果是,发起一个WakeupFlushThread的flush请求,如果超过全局memory的最大值,需要等待flush完成。 b.在HRegionServer进行数据...

2014-04-18 15:57:53 244

原创 memstore的flush流程分析

memstore的flush流程分析memstore的flush发起主要从以下几个地方进行: a.在HRegionServer调用multi进行更新时,检查是否超过全局的memstore配置的最大值与最小值,   如果是,发起一个WakeupFlushThread的flush请求,如果超过全局memory的最大值,需要等待flush完成。 b.在HRegionServer进行数据更

2014-04-18 15:53:56 2461 3

Hlog的相关处理流程不完全分析

 Hlog的相关处理流程: 在对hbase中数据进行更新操作put/delete/append/increment操作时,记录操作日志供日志重播的相关处理。 Hlog的写入通过regionserver实例生成时生成的FSLog为的实例。 通过LogRoller线程定期去检查并删除过期的日志文件。 定期检查的时间间隔通过hbase.regionserver....

2014-04-15 17:59:20 211

原创 Hlog的相关处理流程不完全分析

Hlog的相关处理流程:在对hbase中数据进行更新操作put/delete/append/increment操作时,记录操作日志供日志重播的相关处理。Hlog的写入通过regionserver实例生成时生成的FSLog为的实例。通过LogRoller线程定期去检查并删除过期的日志文件。定期检查的时间间隔通过hbase.regionserver.logroll.period进行配置

2014-04-15 17:51:43 1444

hbase put 流程分析regionserver端

RegionServer端put数据流程分析: client端通过MultiServerCallable.call调用rs的rpc的multi方法。 regionServer实例ClientProtos.ClientService.BlockingInterface接口。     public MultiResponse multi(finalRpcC...

2014-04-15 13:34:12 204

原创 hbase put regionserver处理分析

RegionServer端put数据流程分析:client端通过MultiServerCallable.call调用rs的rpc的multi方法。regionServer实例ClientProtos.ClientService.BlockingInterface接口。publicMultiResponsemulti(finalRpcControllerrpc

2014-04-15 13:24:43 1284 5

hbase put 流程分析client端

数据写入(Put)处理流程分析:Put通过生成一个HTable实例,并调用其put方法时,的执行流程,此部分分析分为client与regionserver两个部分,client端:Htable.put-->doPut,如果是put一个list时,会迭代调用doPutprivatevoiddoPut(Put put) throws InterruptedIOExcept...

2014-04-14 16:19:57 154

原创 HBase put操作client端分析

数据写入(Put)处理流程分析:Put通过生成一个HTable实例,并调用其put方法时,的执行流程,此部分分析分为client与regionserver两个部分,client端:Htable.put-->doPut,如果是put一个list时,会迭代调用doPutprivatevoiddoPut(Putput)throwsInterruptedIOException,

2014-04-14 16:15:46 3541

日志重播分析

日志重播分析 Hbase的日志重播分为启动时的日志重播与rs下线时的日志重播操作。 通过hbase.master.distributed.log.replay来控制日志的split是在region的reopen前执行还是reopen后执行 如果是true表示在reopen后执行,否则相反  Rs下线时的日志重播分析 master监听下线...

2014-04-13 16:42:55 275

原创 日志重播分析

日志重播分析Hbase的日志重播分为启动时的日志重播与rs下线时的日志重播操作。通过hbase.master.distributed.log.replay来控制日志的split是在region的reopen前执行还是reopen后执行如果是true表示在reopen后执行,否则相反Rs下线时的日志重播分析master监听下线master通过RegionServe

2014-04-13 16:41:51 1891

hbase region分配,RS下线处理

RS下线的regionassign上面在RS启动部分已经提到过,RS在zk中的地址注册为SESSION过期自动清理的路径(ephemeral)。在master中通过RegionServerTracker对rs进行监控,当rs在zk的session过期时间内没有向zk发送心跳。表示rs已经下线,会触发RegionServerTracker.nodeDeletedpublicvo...

2014-04-12 20:56:12 129

region assign 流程补充说明

region assign的流程补充Master端:1.regionserver下线,zk中注册的rs节点下的server子路径session过期被删除,  master触发RegionServerTracker.nodeDeleted监听事件,并调用ServerManager.expireServer2.把下线的server添加到deadServers列表中,同时从onlineServers列表...

2014-04-12 20:54:28 122

原创 HMBASE的REGION分配

HMBASE的REGION分配Region assign分为meta的分配与userregion assign,同时包含hbase启动时与rs下线,因此从4个方面来说明regionassign启动时的metaregion assign针对master启动时的补充说明:Hmaster.run.finishInitialization方法中:得到WALs目录下所有子目录,如果...

2014-04-12 20:53:10 179

原创 HBASE REGIONSERVER启动过程

HBASEHRegionServer启动分析regionserver的启动入口是HRegionServer.main方法生成HRegionServercommandLine实例,并执行doMain方法,此方法中通过ToolRunner.run去调用HRegionServercommandLine.run方法a.判断传入参数是start还是stop,如果是start,调用HRe...

2014-04-12 20:49:47 251

hbase0.96.1 hmaster启动过程分析

HBASE HMASTER启动分析Hbase debug配置:找到hbase这个shell脚本文件,在对应的位置,如我要debugmaster,elif[ "$COMMAND" = "master" ] ; thenCLASS='org.apache.hadoop.hbase.master.HMaster'if[ "$1" != "stop" ] && [ ...

2014-04-12 20:45:30 137

原创 region assign 流程补充说明

region assign的流程补充Master端:1.regionserver下线,zk中注册的rs节点下的server子路径session过期被删除,  master触发RegionServerTracker.nodeDeleted监听事件,并调用ServerManager.expireServer2.把下线的server添加到deadServers列表中,同时从onl

2014-04-11 15:04:35 1467

原创 hbase region分配,RS下线处理

RS下线的regionassign上面在RS启动部分已经提到过,RS在zk中的地址注册为SESSION过期自动清理的路径(ephemeral)。在master中通过RegionServerTracker对rs进行监控,当rs在zk的session过期时间内没有向zk发送心跳。表示rs已经下线,会触发RegionServerTracker.nodeDeletedpublicvoidn

2014-04-03 11:49:57 2297

原创 HMBASE的REGION分配

HMBASE的REGION分配Region assign分为meta的分配与userregion assign,同时包含hbase启动时与rs下线,因此从4个方面来说明regionassign启动时的metaregion assign针对master启动时的补充说明:Hmaster.run.finishInitialization方法中:得到WALs目录下所有子目录,如果W

2014-04-02 18:29:58 2186

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除