- 博客(5)
- 资源 (7)
- 收藏
- 关注
转载 Hadoop map调优参数
参数:io.sort.mb(default 100) 当map task开始运算,并产生中间数据时,其产生的中间结果并非直接就简单的写入磁盘。 而是会利用到了内存buffer来进行已经产生的部分结果的缓存, 并在内存buffer中进行一些预排序来优化整个map的性能。 每一个map都会对应存在一个内存buffer,map会将已经产生的部分结果先写入到该buffer中, 这个buffer默认
2015-12-26 20:13:20 1227
转载 一共81个,开源大数据处理工具汇总
原文出处: 36大数据:一共81个,开源大数据处理工具汇总(上) 36大数据:一共81个,开源大数据处理工具汇总(下),包括日志收集系统/集群管理/RPC等第一部分查询引擎一、Phoenix贡献者::Salesforce简介:这是一个Java中间层,可以让开发者在Apache HBase上执行SQL查询。Phoenix完全使用Java编写,代码位于GitHub上,并且提供了一个客户端可嵌入的JD
2015-12-24 15:14:32 3624
原创 MapReduce框架中Key-Value对象的重用
从代码看问题@Override protected void reduce(Text key, Iterable<Text> values,Context context) throws IOException, InterruptedException { List<Text> list =new ArrayList<Stri
2015-12-24 14:50:09 2228
原创 MapReduce输入输出类型对应关系
如图Mapper的输出类型要和Combiner的输入类型对应; Combiner的输出类型要和Reducer的输入类型对应; Mapper的输出类型要和Reducer的输入类型对应; 如果没有单独设置Mapper的输出类型,则和Reducer一样都受如下配置信息控制。 job.setOutputKeyClass(Text.class); job.setOutput
2015-12-08 09:56:29 901
WaveAnimLayoutProject
2015-03-24
利用MediaPlayer和SurfaceView播放视频
2014-10-27
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人