spark
半湖思絮
IT
展开
-
Spark关于Java的RDD操作
在之前的文章中Spark的demo对RDD的简单操作,通过学习《Spark快速大数据分析》,记录一下对RDD的详细操作1.转化操作map我们可以使用map()来做各种各样的事情:可以把我们的URL集合中的每个URL对应的主机名提取出来,也可以简单到只对各个数字求平方值。map()的返回值类型不需要和输入类型一样。这样如果有一个字符串RDD原创 2016-12-27 17:14:58 · 1107 阅读 · 0 评论 -
Spark MLlib java TF-IDF计算 (spark 1.5.2)
import java.util.Arrays;import java.util.List;import org.apache.spark.SparkConf;import org.apache.spark.api.java.JavaRDD;import org.apache.spark.api.java.JavaSparkContext;import org.apache.spark原创 2017-02-08 14:28:55 · 1951 阅读 · 0 评论 -
基于Spark Mllib, 使用java api操作的电影推荐系统(spark1.5.2 jdk1.7)
最近在学习Spark Mllib,看了一些它的算法,但不知道算法怎么去应用,网上的实例大部分都是使用Scala语言写的,没有java的代码,从网上找到了一篇基于Spark Mllib,SparkSQL的电影推荐系统 也是使用Scala语言(对其不是很了解,暂时也没有多少时间去学),还好他讲得特别细,关于测试数据他都有下载地址,在这就不多说了。直接把由其改写的java代码附上:import j原创 2017-02-10 15:29:58 · 5810 阅读 · 4 评论