从examples中学Spark
文章平均质量分 80
haixwang
。。。。。。
展开
-
从examples中学Spark(一):BroadcastTest.scala
之前学习都是官网API Doc+社区的博文,最近参考了几篇examples,发觉example+doc才是绝配。 由于集群Spark版本是2.1.1,所以我学习的examples示例是2.1.1版本中的,2.2.0版本中关于ml【也就是DataFrame版的mllib】的examples有不少内容与2.1.1版本不同。 注意:使用ml的一些example还需要导入examples下的scopt_原创 2018-01-04 14:46:03 · 656 阅读 · 0 评论 -
从examples中学spark(二):ModelSelectionViaCrossValidationExample.scala以及模型保存
学习前(理论)最小二乘法、岭回归、Lasso等学习中(领悟)1.首先是一段包导入,跳过import org.apache.log4j.{Level, Logger}import org.apache.spark.ml.Pipelineimport org.apache.spark.ml.classification.LogisticRegressionimport or原创 2018-01-06 21:36:40 · 1085 阅读 · 0 评论 -
从examples中学spark(三):ALSExample.scala
学习前理论学习中领悟学习后实操总结参考学习前(理论)最小二乘法(Spark使用的是交叉最小二乘法(ALS)来最优化损失函数——ALS 的目标函数不是凸函数,所以固定一部分参数优化另外一部分参数,从而一般很难求得全局最优解)基于矩阵分解的推荐算法(评分数据集中,并不是每个用户都对每个产品进行过评分,所以这个矩阵往往是很稀疏的【所以更应该多注意过拟合的问题】,...原创 2018-02-23 23:22:48 · 647 阅读 · 0 评论 -
TODO集合
从今天开始,我把所有18年起的TODO,都同步到这篇文章。 一方面是方便自己常“回来看看“,记得解决这些疑惑; 另一方面,希望知道/有解决思路的前辈们能留言或者(QQ911283415)指点一二,感激! (序列中所有非链接字体以及【】中的文字,可在文章中搜索定位)九、2018年06月23日:关于Object类一些重要方法的深入理解及重载第一段测试代码中,两个Integer引用未一...原创 2018-06-23 22:23:44 · 379 阅读 · 0 评论