- 博客(3)
- 资源 (4)
- 收藏
- 关注
转载 MapReduce之mapOutputBuffer解析
转载地址:http://blog.csdn.net/wangqinghuan1993/article/details/53785403MapOutPutBuffer就是map任务暂存记录的内存缓冲区。不过这个缓冲区是有限的,当写入的数据超过缓冲区设定的阈值时,需要将缓冲区的数据写入到磁盘,这个过程叫spill。在溢出数据到磁盘的时候,会按照key进行排序,保证刷新到磁盘的记录时排好序的。该缓冲
2017-02-22 09:25:08 2659
原创 hbase region 手动 split
综合一下几个方面考虑是否需要进行split1、requests次数是否均匀,如出现了极不均匀的情况下:2、各regions的storefile 大小:若storefile size出现比较大的情况时。3、如何进行region split3.1、选中需要进行split region的region name,如上图红框内的就是region name.3.2、把选中的region
2017-02-16 12:18:03 5872
转载 hbase 运维
1.1监控Hbase运行状况 1.1.1操作系统 1.1.1.1IO a.群集网络IO,磁盘IO,HDFS IO IO越大说明文件读写操作越多。当IO突然增加时,有可能:1.compact队列较大,集群正在进行大量压缩操作。 2.正在执行mapreduce作业 可以通过CDH前台查看整个集群综合的数据或进入指定机器的前台查看单台机器的数据: b.Io wait
2017-02-08 08:34:22 1010
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人