- 博客(7)
- 资源 (10)
- 收藏
- 关注
转载 下一代的APACHE HADOOP MAPREDUCE : YARN
本文翻译自:http://developer.yahoo.com/blogs/hadoop/posts/2011/02/mapreduce-nextgen/原文地址:http://www.rigongyizu.com/the-next-generation-of-apache-hadoop-mapreduce/概述在大数据商业领域,运行少而大的集群比运行很多小的集群成本更低
2014-02-18 14:24:57 1421
转载 HADOOP 2.0 YARN应用程序的执行流程和开发
在yarn的官方文档上有一篇很经典的Hadoop MapReduce Next Generation – Writing YARN Applications,讲述了如果编写基于hadoop 2.0 yarn的应用程序(中文翻译版)。本文主要讲述yarn程序的执行流程和如何进行开发的一点想法。原文地址:http://www.rigongyizu.com/how-to-write-hado
2014-02-18 12:50:22 3885
转载 下一代的HADOOP MAPREDUCE – 如何编写YARN应用程序
本文翻译自hadoop官方文档:Hadoop MapReduce Next Generation – Writing YARN Applications原文地址:http://www.rigongyizu.com/hadoop-mapreduce-next-generation-writing-yarn-applications/目的本文在一个比较高的层面上描述了如何在
2014-02-18 10:11:37 1564
转载 SVN中tag branch trunk用法详解
本节主要讲解一下SVN中tag branch trunk的用法,在SVN中Branch/tag在一个功能选项中,在使用中也往往产生混淆。这里就向大家简单介绍一下,欢迎大家能和我一起学习SVN中tag branch trunk的用法。 在实现上,branch和tag,对于svn都是使用copy实现的,所以他们在默认的权限上和一般的目录没有区别。至于何时用tag,何时用branch,完全由
2014-02-17 18:17:59 1368
转载 Hive小文件合并调研
背景Hive query将运算好的数据写回hdfs(比如insert into语句),有时候会产生大量的小文件,如果不采用CombineHiveInputFormat就对这些小文件进行操作的话会产生大量的map task,耗费大量集群资源,而且小文件过多会对namenode造成很大压力。所以Hive在正常job执行完之后,会起一个conditional task,来判断是否需要合并小文件,如果
2014-02-13 15:00:50 1215
原创 hql中小文件合并操作
老大昨天发给我一个hql:create table zx_car_weibo_41_tmpas select * from ods_tblog_content where dt = '20130101' and ((content like '%4C%') or ( extend like '%4C%')) and ((content like '%雪铁龙%') or
2014-02-13 14:57:39 3207
转载 深入理解SetUID
最近在看hadoop关于map/reduce任务运行部分的代码,看到任务启动时的权限涉及到linux的setuid,以下是关于介绍setuid的一篇很好的文章,贴出来以备后用。==============================================================================================================
2014-02-12 16:20:02 1408
HTTP协议详解 学习servlet的必备资料
2009-10-25
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人