spark
文章平均质量分 88
sina微博_SNS程飞
个人网站:www.ymshici.com
研究方向:机器学习数据挖掘社交网络推荐系统
展开
-
【spark系列2】spark中运行scala程序(build.sbt中的版本号问题)
参考资料:1. http://www.cnblogs.com/vincent-hv/p/3298416.html原创 2014-04-14 23:55:12 · 2259 阅读 · 0 评论 -
scala broadcast
scala> val broadcastVar = sc.broadcast(Array(1, 2, 3))broadcastVar: org.apache.spark.broadcast.Broadcast[Array[Int]] = Broadcast(0)scala> broadcastVar.valueres0: Array[Int] = Array(1, 2, 3)原创 2017-05-03 16:42:31 · 2493 阅读 · 0 评论 -
hadoop vs spark
Hadoop首先看一下Hadoop解决了什么问题,Hadoop就是解决了大数据(大到一台计算机无法进行存储,一台计算机无法在要求的时间内进行处理)的可靠存储和处理。HDFS,在由普通PC组成的集群上提供高可靠的文件存储,通过将块保存多个副本的办法解决服务器或硬盘坏掉的问题。MapReduce,通过简单的Mapper和Reducer的抽象提供一个编程模型,可以在一个由几十台上百台的PC组转载 2015-07-13 17:34:56 · 1189 阅读 · 0 评论 -
【spark系列3】spark开发简单指南
spark开发简单指南原创 2014-04-19 23:52:20 · 2025 阅读 · 0 评论 -
【spark系列7】协同过滤之ALS
其它步骤请参考【系列4】注意单机跑的时候原创 2014-04-20 20:58:54 · 2021 阅读 · 0 评论 -
【spark系列5】回归之LinearRegressionWithSGD
scala程序原创 2014-04-20 17:26:29 · 6389 阅读 · 2 评论 -
【spark系列1】spark安装
1.官网下载spark源码,我下载的是0.9.1版本的2.在spark目录下,运行S原创 2014-04-14 21:29:06 · 1082 阅读 · 0 评论 -
【spark系列4】分类之SVMWithSGD
参考资料:1.官网 http://spark.apache.org/docs/latest/mllib-guide.html原创 2014-04-20 17:20:06 · 7670 阅读 · 0 评论 -
【spark系列6】聚类之KMeans
其它流程请参考【spark系列4】代码原创 2014-04-20 20:10:52 · 1446 阅读 · 0 评论 -
spark maxResultSize
INFO org.apache.spark.deploy.yarn.ApplicationMaster: Unregistering ApplicationMaster with FAILED (diag message: User class threw exception: org.apache.spark.SparkException: Job aborted原创 2017-05-17 13:54:56 · 4078 阅读 · 0 评论