• 我的消息
  • 我的博客
  • 我的学院
  • 我的下载
  • 我的收藏
  • 消息
  • 搜索条件:
    点击返回全部
    全部文章 > {categoryName }
    • Hadoop streaming mapreduce多文件输入使用方法

      写Mapreduce程序时,常常会有同时处理多个输入文件的的需求,那么如何在map程序中方便的知道这一条record到底来自哪个文件呢?如果数据源是可控的,我们尚可以通过字段的个数等来判断,然而这不是...

      原创
      2017-03-18 19:36:03
      1464
      0
    • MapReduce二次排序(secondary sort)实战

      接触过mapreduce的同学都知道,为了将key值相同的record放在一起,分配给指定reducer,shuffle阶段会按照key值排序。 然而在某些情况下,我们需要同时对value排序,...

      原创
      2017-03-18 19:05:45
      330
      0
    • Java程序优雅关闭的两种方法

      使用java编写大型系统时,往往需要在程序被kill时将内存中的一些临时数据和状态处理掉,这里称之为优雅关闭。介绍两种比较典型的方法。

      原创
      2016-09-28 10:58:41
      3528
      0
    • ElasticSearch java API - 聚合查询

      Elastic Search Java API 各种聚合(Aggregation)查询的实现

      原创
      2016-09-20 17:20:15
      6840
      1
    • Clojure环境配置-Eclipse安装Counterclockwise

      Eclipse 提供了专门的Clojure 语言开发插件CounterClockwise,在源代码编辑,代码调试,REPL 支持方面也有独到之处,适合于习惯于Eclipse 的开发者使用。 项目

      原创
      2014-07-21 15:30:16
      1251
      0
    • jstorm集群配置部署过程全纪录

      Jstorm是阿里在storm的基础上开发的一个流计算系统,提供比storm更多的功能和

      原创
      2014-07-11 15:10:56
      6522
      0
    • Hadoop Capacity Scheduler配置与使用

      Capacity Scheduler简介 Capacity Scheduler支持以下特性: (1) 计算能力保证。支持多个队列,某个作业可被提交到某一个队列中。每个队列会配置一定比例的计算资...

      原创
      2013-04-19 09:46:41
      681
      0
  • 学院
  • 下载
  • 消息