- 博客(3)
- 收藏
- 关注
转载 用Hadoop1.0.3实现KMeans算法
Data Mining,NLP,Search Engine 用Hadoop1.0.3实现KMeans算法 从理论上来讲用MapReduce技术实现KMeans算法是很Natural的想法:在Mapper中逐个计算样本点离哪个中心最近,然后Emit(样本点所属的簇编号,样本点);在Reducer中属于同一个质心的样本点在一个链表中,方便我们计算新的中心,然后Emit(质心编号,质心)。但是技
2013-10-08 15:07:59 584
转载 常见MapReduce模式和算法
本文译自 Mapreduce Patterns, Algorithms, and Use Cases 在这篇文章里总结了几种网上或者论文中常见的MapReduce模式和算法,并系统化的解释了这些技术的不同之处。所有描述性的文字和代码都使用了标准hadoop的MapReduce模型,包括Mappers, Reduces, Combiners, Partitioners,和 sorting。
2013-10-08 15:05:22 636
转载 hadoop面试题
面试hadoop可能被问到的问题,你能回答出几个 ? 1、hadoop运行的原理? 2、mapreduce的原理? 3、HDFS存储的机制? 4、举一个简单的例子说明mapreduce是怎么来运行的 ? 5、面试的人给你出一些问题,让你用mapreduce来实现? 比如:现在有10个文件夹,每个文件夹都有1000000个url.现在让你找出top10
2013-10-08 14:59:36 935
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人