hadoop下算法开发
小飞侠-2
我的github地址https://github.com/liujiekasini 欢迎大家分享讨论
展开
-
hadoop下kmeans算法实现四
KMapper.java [java] view plaincopy import java.io.ByteArrayOutputStream; import java.io.IOException; import java.net.URI; import java.util.StringTokenizer; im转载 2015-12-23 16:35:24 · 424 阅读 · 0 评论 -
hadoop下的Kmeans算法实现三
初始化中心点CenterInitial.java [java] view plaincopy import java.io.ByteArrayInputStream; import java.io.ByteArrayOutputStream; import java.io.IOException; import java.io.转载 2015-12-23 16:36:05 · 376 阅读 · 0 评论 -
hadoop下的Kmeans算法实现一
前一段时间,从配置hadoop到运行kmeans的mapreduce程序,着实让我纠结了几天,昨天终于把前面遇到的配置问题和程序运行问题搞定。Kmeans算法看起来很简单,但对于第一次接触mapreduce程序来说,还是有些挑战,还好基本都搞明白了。Kmeans算法是从网上下的在此分析一下过程。 Kmeans.java [java] view plaincopy转载 2015-12-23 16:39:01 · 570 阅读 · 0 评论 -
Hadoop中常用的InputFormat、OutputFormat(转)
Hadoop中的Map Reduce框架依赖InputFormat提供数据,依赖OutputFormat输出数据,每一个Map Reduce程序都离不开它们。Hadoop提供了一系列InputFormat和OutputFormat方便开发,本文介绍几种常用的: TextInputFormat 作为默认的文件输入格式,用于读取纯文本文件,文件被分为一系列以LF或者CR结束的行,key是每一转载 2015-12-23 16:40:20 · 1615 阅读 · 0 评论