- 博客(3)
- 资源 (2)
- 收藏
- 关注
原创 利用 mahout 实现的 k-means 算法对欧冠球队分档
网络上现在介绍mahout实现的 k-means 算法很多都使用Synthetic Control Chart Time Series数据synthetic_control.data 来做分析的数据。不过对于初学者来说,synthetic_control.data 的数据可能不太便于理解(它包括600个数据点,每个数据点有60个属性),同时分析出来的结果也不直观,难以在初学者脑中迅速形成感性的印象
2013-11-18 22:40:33 2218 1
原创 Yarn的JVM重用功能——uber
在文章开头,我想先做几点说明:1、本文的内容来自我对Yarn的相应功能的理解和实践。而我对该部分功能的理解主要来自对Hadoop的开发者之前相应言论的分析,并且我也将我的分析发给了Hadoop community, 并得到了Yarn的创始人兼架构师Arun Murthy的肯定回复。2、本文中uber的配置部分,主要参考之前Hadoop开发者的言论。但是我当初看该言论的时候对一些细节有所疑惑
2013-11-12 22:54:50 10088 4
原创 Hadoop 1.x 版本中的Task Controller 介绍
目前网络上对Hadoop 的 TaskController介绍的资料虽然不算少,但感觉纯谈感念的占多数,可能会使读者理解起来感到比较抽象,因此我在这里整理了一些自己对Task Controller的浅见,以及为本文设计的实例,希望能对读者起到一点帮助。 本文介绍Task Controller的顺序为:作用、配置、原理(由表及里、由浅入深)。另外,本文的代码是基于ApacheHadoop-1
2013-11-02 19:31:50 1879
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人