mahout
iteye_5304
这个作者很懒,什么都没留下…
展开
-
【1】使用mahout进行数据挖掘
mahout使用:步骤一:tar -xvf mahout-0.3.tar.gz需要指定hadoop的路径和配置文件的路径export HADOOP_HOME=/home/hadoopuser/hadoop-0.19.2 export HADOOP_CONF_DIR=/home/hadoopuser/hadoop-0.19.2/conf步骤二:通过这个命令可以查看mahout提供了哪些算...原创 2010-11-05 17:56:35 · 265 阅读 · 0 评论 -
K-means聚类方法
K-means聚类方法就是把空间内点,分成K类。同一聚类中的对象相似度较高;而不同聚类中的对象相似度较小。用均值来代表类中心,并用于衡量与新点的距离。初始值:根据先验知识找到K个均值,做迭代初始值。迭代公式:1:从n个数据对象中选择k个对象作为初始聚类中心2:将剩下的n-k个数据对象,按照他们和初始的k个值之间的距离大小,分配给与其最近的聚类。3:计...2011-02-25 15:23:21 · 158 阅读 · 0 评论 -
mahout下处理的文件必须是SequenceFile格式的,所以需要把txtfile转换成sequenceFile
mahout下处理的文件必须是SequenceFile格式的,所以需要把txtfile转换成sequenceFile。SequenceFile是hadoop中的一个类,允许我们向文件中写入二进制的键值对,具体介绍请看eyjian写的http://www.hadoopor.com/viewthread.php?tid=144&ampmahout中提供了一种将指定文件下的文件转换成sequen...2011-03-06 23:07:34 · 343 阅读 · 0 评论