hadoop
文章平均质量分 78
forbabyx
这个作者很懒,什么都没留下…
展开
-
Hadoop-相关文章
原创 2012-10-03 20:14:06 · 114 阅读 · 0 评论 -
HBase-打印日志内容分析
Put操作这个rowkey触发了一个CountDownLatch等待超时抛出的异常。原创 2014-05-15 17:14:05 · 602 阅读 · 0 评论 -
HBase-服务端处理请求的过程
m.verify(默认false) 是否启用checksumhbase.server.thread.wakefrequency(默认10*1000) 线程检查频率hbase.regionserver.numregionstoreport(默认10) ???hbase.regionserver.handler.count(默认10) handler处理线程个数hbase.regionserver.metahandler.count(默认10) 处理meta和root的线程个数hbase.r原创 2014-05-19 19:19:44 · 361 阅读 · 0 评论 -
HBase-客户端请求
.client.pause1秒重试的休眠时间 hbase.client.retries.number10重试次数 hbase.client.rpc.maxattempts1 hbase.rpc.timeout60秒 hbase.client.prefetch.limit10 hbase.client.write.buffer2097152 hbase.client.scanner.caching1一次从服原创 2014-05-27 19:46:23 · 342 阅读 · 0 评论 -
Hadoop-commons分析
L文件,使用SAX解析配置文件my-config.xml格式<?xml version="1.0" encoding="UTF-8"?><?xml-stylesheet type="text/xsl" href="configuration.xsl"?><configuration> <property&原创 2014-10-22 18:19:19 · 319 阅读 · 0 评论 -
Hadoop-balancer执行原理
无需迁移"; } 2.选择需要迁移的节点 if(需要移动的数据 == 0) { return "没有需要移动的块" } 3.开始并行迁移 4.清空列表 5.Thread.sleep(2*conf.getLong("dfs.heartbeat.interval", 3));} 获取所有的data node节点,计算initNodes(client.getDatanodeReport(Datanode原创 2015-01-28 21:19:10 · 165 阅读 · 0 评论 -
Hbase-HMaster架构
handler线程(IPC Handler和 用于replication的IPC Handler)2.执行服务都是一些线程池,当有任务出现时就就会交给这些类来处理这些线程有MASTER_SERVER_OPERATIONSMASTER_META_SERVER_OPERATIONSMASTER_CLOSE_REGIONMASTER_OPEN_REGIONMASTER_TABLE_OPERATIONS相关的hanlder有:OpenRegionHandlerClosed原创 2015-03-24 19:21:10 · 313 阅读 · 0 评论 -
HBase-压缩和分割原理
mpaction()函数规则来判断是提交到//largeCompactions线程池还是smallCompactions线程池CompactSplitThread#requestCompaction() { for (Store s : r.getStores().values()) { CompactionRequest cr = Store.requestCompaction(priority, request); ThreadPoolExecutor pool = s.thro原创 2015-03-31 11:33:44 · 212 阅读 · 0 评论 -
HBase-cache相关
lowerLimit 默认为0.35 cacheFlusher线程主要用于定期清理 memstore中的数据,具体逻辑如下://在单独线程中运行,定期检查是否有//超过阈值的region,有则执行flush操作MemStoreFlusher#run() { fqe = flushQueue.poll(threadWakeFrequency, TimeUnit.MILLISECONDS); if (fqe == null || fqe instanc原创 2015-04-09 15:03:11 · 121 阅读 · 0 评论 -
Hadoop-远程过程调用
address; //远端服务器的地址 UserGroupInformation ticket; //用户和用户组的信息 Class<?> protocol; //IPC接口对应的类对象}//ConnectionHeader类是客户端和服务端TCP连接建立之后交换的第一条消息,包括ConnectionId中的//用户信息和IPC接口信息,用于确认用户是否有权利连接Co原创 2015-06-15 16:46:47 · 174 阅读 · 0 评论 -
HBase-遇到的问题
tch put, row=0001558252搜索关键字"Failed getting lock in batch put"整个hbase代码中只有一个地方出现了这个关键字 1.HRegionServer#multi()接收到multi操作,找到某个region对其操作这里会创建mutation操作,和对应的锁,锁是用RowLock获得的,默认锁id是-1,如果是-1则返回null,这样构造出的Pair对的first就是mutation,second就是null了,再原创 2014-05-15 16:43:48 · 247 阅读 · 0 评论 -
HBase-HFile的读写操作
_SIZE = 10; public TestWrit() { cfg.setInt("hfile.index.block.max.size", BLOCK_INDEX_SIZE); cfg.setInt("io.storefile.bloom.block.size", BLOOM_BLOCK_INDEX_SIZE); //cfg.setBoolean("hbase.regionserver.checksum.verify",原创 2014-05-03 19:40:16 · 713 阅读 · 0 评论 -
HBase-WAL相关线程处理逻辑
写入到hadoop的,也就是先写WAL,再做更新(或者删除)这些操作是在handle线程中完成的1.handle先创建一个WAL,放入队列中2.之后检查标志位,是否是同步写WAL3. a)如果是再从队列中获取WAL,写入到haddop中 b)此时,日志同步线程也会定期检查队列,将队列中的WAL获取后写入到hadoop中 所以这里是有两个地方可以写WAL,handle线程中不管有没有配置同步写标志, LogSyncer线程都会写WALLogSyncer默认是1秒同步一次WA原创 2014-02-28 19:21:05 · 291 阅读 · 0 评论 -
Hadoop-环境搭建
原创 2013-06-27 16:58:17 · 79 阅读 · 0 评论 -
HBase-各种API操作
cfg = new HBaseConfiguration(HBASE_CONFIG); cfg.set("hbase.master", "master ip:60000");[/code]创建表[code="java"] public void createTable(String tablename) throws IOException { HBaseAdmin admin = new HBaseAdmin(原创 2013-07-03 11:08:56 · 103 阅读 · 0 评论 -
Hadoop-常见问题
doop使用常见问题以及解决方法[url]http://www.hadoopor.com/thread-71-1-1.html[/url]如何解决伪分布无法启动datanode的问题[url]http://elektrobank.iteye.com/blog/1264775[/url]hadoop格式化失败原因[url]http://blog.sina.com.cn/s/blog_48a45b9501011z7d.html[/url]在对namenode格式化之前,要确保原创 2013-07-05 12:50:32 · 77 阅读 · 0 评论 -
Hadoop-常用操作
); } public void test1() throws IOException { URL u = new URL("hdfs://IP:8020/test"); InputStream is = u.openStream(); BufferedReader br = new BufferedReader(new InputStreamReader(is)); String line = null; while( (line=原创 2013-07-19 11:35:53 · 154 阅读 · 0 评论 -
HBase-线程调整
原创 2013-08-20 17:14:33 · 186 阅读 · 0 评论 -
HBase-HFile分析
原创 2014-01-10 19:25:03 · 346 阅读 · 0 评论 -
HBase-HLog分析
gionserver.hlog.writer.implSequenceFileLogWriterHLog.Writer实现类hbase.regionserver.hlog.reader.implSequenceFileLogReaderHLog.Reader实现类hbase.regionserver.hlog.keyclassHLogKeyHLog.Entry的key实现类hbase.regionserver.wal.enablecompressionfa原创 2014-02-08 17:37:29 · 267 阅读 · 0 评论 -
HBase-RegionServer架构
原创 2014-02-28 19:06:41 · 401 阅读 · 0 评论 -
HBase-region server的线程
未知,看名字似乎是用于 小合并的Daemon Thread [regionserver60020-smallCompactions-1392958977368] (Suspended)Unsafe.park(boolean, long) line: not available [native method]LockSupport.park(Object) line: 156AbstractQueuedSynchronizer$ConditionObject.await() line: 198原创 2014-02-28 19:19:31 · 205 阅读 · 0 评论 -
Hadoop-DataNode分析
过IPC调用namenode的mkdir()这个操作会持久化到日志中FSImage#saveFSImage(),之后返回创建目录只是客户端和namenode交互,不会跟datanode交互 删除文件操作操作类似mkdir(),但是删除操作只是删除namenode中的引用关系,并不会真正删除datanode中的数据,namenode和datanode只是维持简单的主从关系,namenode不会向datanode发起任何IPC操作,datanode的数据删除操作是通过心跳原创 2016-04-06 18:41:48 · 337 阅读 · 0 评论