- 博客(13)
- 资源 (6)
- 收藏
- 关注
转载 详细探究Spark的shuffle实现和hadoop mapreduce shuffle原理
详细探究Spark的shuffle实现和hadoop mapreduce原理 详细探究Spark的shuffle实现和hadoop mapreduce原理
2016-06-25 16:36:47 4758
转载 HBase深入分析之RegionServer
http://www.binospace.com/index.php/hbase-in-depth-analysis-of-the-regionserver/?utm_source=tuicool&utm_medium=referral所有的用户数据以及元数据的请求,在经过Region的定位,最终会落在RegionServer上,并由RegionServer实现数据的读写操作。
2016-06-22 23:28:00 4782
原创 Hadoop中Partition解析 和 storm的grouping
解析PartitionMap的结果,会通过partition分发到Reducer上,Reducer做完Reduce操作后,通过OutputFormat,进行输出,下面我们就来分析参与这个过程的类。Mapper的结果,可能送到Combiner做合并,Combiner在系统中并没有自己的基类,而是用Reducer作为Combiner的基类,他们对外的功能是一样的,只是使用的位置和使用时
2016-06-19 14:23:03 971
原创 使用scala实现pageRank算法
使用scala实现pageRank算法 使用scala实现pageRank算法 使用scala实现pageRank算法 使用scala实现pageRank算法
2016-06-02 19:38:31 3023
原创 Flume 数据采集系统 性能优化和关键问题汇总
Flume 性能优化 和关键问题汇总 Flume 数据采集系统 性能优化和关键问题汇总 Flume 数据采集系统 性能优化和关键问题汇总
2016-06-01 20:02:56 13435
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人