spark
LXYTSOS
计算机视觉与强化学习。
展开
-
Machine Learning With Spark学习笔记
此笔记为本人在阅读Machine Learning With Spark的时候所做的,笔记有翻译不准确或错误的地方欢迎大家指正。Spark集群Spark集群由两种进程组成:一个驱动程序和多个执行程序。在本地模式下,所有的进程都在同一个Java虚拟机中运行。在集群上,这些进程则通常在多个节点上运行。比如,在单机环境下运行的集群有以下特征: 1、一个主节点作为spark单机模式的主进程和驱动程序。原创 2015-07-01 14:23:12 · 4504 阅读 · 1 评论 -
Machine Learning With Spark学习笔记(在10万电影数据上训练、使用推荐模型)
我们现在开始训练模型,还输入参数如下: rank:ALS中因子的个数,通常来说越大越好,但是对内存占用率有直接影响,通常rank在10到200之间。 iterations:迭代次数,每次迭代都会减少ALS的重构误差。在几次迭代之后,ALS模型都会收敛得到一个不错的结果,所以大多情况下不需要太多的迭代(通常是10次)。 lambda:模型的正则化参数,控制着避免过度拟合,值越大,越正则化。我们将原创 2015-08-14 16:56:26 · 5046 阅读 · 5 评论 -
Machine Learning With Spark学习笔记(提取10万电影数据特征)
注:原文中的代码是在spark-shell中编写执行的,本人的是在eclipse中编写执行,所以结果输出形式可能会与这本书中的不太一样。首先将用户数据u.data读入SparkContext中,然后输出第一条数据看看效果,代码如下:val sc = new SparkContext("local", "ExtractFeatures") val rawData = sc.textFile("F:\\原创 2015-08-14 11:38:33 · 4223 阅读 · 0 评论