![](https://img-blog.csdnimg.cn/20201014180756926.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
mlib
weitac王
这个作者很懒,什么都没留下…
展开
-
spark机器学习实现之fpgrowth
很久之前就像写一些关于数据挖掘算法的东西,因为懒现在才开始动手,因为fpgrowth算法在mlib中的实现 相对比较简单,所以打算先拿它下手。 关于fpgrowth的原理本人说的也不专业, 推荐 http://blog.csdn.net/huagong_adu/article/details/17739247这里主要写一下在mlib当中,实现的一个过程 先上代码Logger.getLog原创 2017-09-25 17:16:39 · 1301 阅读 · 0 评论 -
spark机器学习之als
今天分析一下als算法在spark mlib中的相关应用,关于原理性的东西,还是不多做介绍,als本身是协同过滤算法的一种,08年以来也是使用最频繁的协同过滤算法了。主要的原理性东西,推荐这篇博客: http://blog.csdn.net/antkillerfarm/article/details/53734658本文章在这里主要还是介绍als算法在spark mlib中的应用,以及在构建r原创 2017-12-06 10:21:46 · 536 阅读 · 0 评论 -
spark代码sc统一配置
之前写了两篇关于mlib的应用,其实都是在一个project内的,在创建sc的过程中,可以通过继承统一的trait简化sc的创建。val postgprop = new Properties val path = this.getClass.getResourceAsStream("/config.properties")读取相关配置文件key.name=valuejdbcURL=jdbc:m原创 2017-12-06 11:04:40 · 1872 阅读 · 0 评论 -
spark机器学习实现之随机森林
还是按照以前交代的,通过接口配置sc,忘记的可查看 http://blog.csdn.net/wangkai198911/article/details/78728449通过sqlcontext直接创建dataframe,数据格式的为libsvm,label: double, features: vectorlabel即为分类标签,features是特征,以vector的方式进行保存//原创 2017-12-26 12:01:20 · 1757 阅读 · 3 评论