2010年12月_lance_123

12月 11月 10月 08月 07月 05月 04月 03月 02月 01月

原创初次与erlang见面

学习分布式相关知识也有一年多了，最早是从hadoop开源项目开始，在几个月前打算学习erlang，但是由于时间关系，一直没有进行，也买了那本经典erlang的E文书，昨天把书过了一遍，在网上找了些文档，安装了一下开发环境，以及运行了一些简单实例，有一种想见恨晚的感觉，接下来的学习列表会多加一个东西，那就是erlang，由于它最早是来自于电信行业，不得不提在目前的电信行业，并发量和高性能还是很重要的，所以erlang在这些方面肯定不差。贴一个快速排序的代码： sort([]) ->[]; sort([

2010-12-26 15:37:00 2173

原创 Capacity Scheduler and Dynamic Scheduler

CapacityTaskScheduler链接：http://hadoop.apache.org/common/docs/r0.19.2/capacity_scheduler.htmlhttp://hadoop.apache.org/common/docs/r0.20.2/capacity_scheduler.htmlhttps://issues.apache.org/jira/browse/HADOOP-3445特性：支持多个队列，每个job 只会被提交到一个队列上。每个队列被分配了集群容量的一部分容量

2010-12-21 22:36:00 2247

原创 hadoop中的streaming和pipes

Streaming应用程序在提交streaming job的命令样例，需要指定JAR包以及相应的参数值。$HADOOP_HOME/bin/hadoop jar $HADOOP_HOME/hadoop-streaming.jar / -input myInputDirs / -output myOutputDir / -mapper myPythonScript.py / -reducer /bin/wc / -file myPythonScri

2010-12-11 18:10:00 3813 4

原创 FairScheduler(公平调度器)的源码阅读

FairScheduler是hadoop中的作业公平调度器，主要是解决当TT发送心跳告诉JT当前的空闲slots时，希望JT分配给TT相应多个task，让TT去执行这些task。所以JT就需要一个调度器来对作业进行调度，选择出作业，然后将作业的task分配TT去执行。而hadoop中的task可以分为map,reduce,jobsetup,jobcleanup,taskcleanup这五种task。关于setup,cleanup task的信息在https://issues.apache.org/jira/

2010-12-05 14:52:00 4519

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 初次与erlang见面

原创 Capacity Scheduler and Dynamic Scheduler

原创 hadoop中的streaming和pipes

原创 FairScheduler(公平调度器)的源码阅读

空空如也

空空如也

原创初次与erlang见面