scala
文章平均质量分 77
爱生活的程序猿
这个作者很懒,什么都没留下…
展开
-
scala实现Kmeans算法
好久没有写博客了,虽然并没有多少人看。kmeans的思想大家自己去查找,我就不一一叙述了。kmeans之所以不能达到全局最优,是因为他的cost函数是一个非凸的函数,找不到最低点那个位置。kmeans的初始位置很重要,本片博客采取的就是最基本的随机生成初始中心点(我很好奇,有些人的代码就是随机生成n和点,都不带判重的),比较 好的生成算法是kmeans++,保证初始点间的距离最远。这是我初学sca原创 2016-12-15 11:57:09 · 3812 阅读 · 0 评论 -
spark下实现并行kmeans算法
相比于本人上篇博客中scala实现的串行kmeans而已,这次的优点体现在并行的计算,并同时运行多组kmeans算法(选取不同的初值),选择其中效果最好的作为结果输出作为一个初学者,这次的编程让我初步的体会到了函数式编程的魅力,让我见识到了并行计算,学习的道路还有很长啊package zzlimport org.apache.spark.mllib.linalg.Vectorim原创 2016-12-22 19:33:45 · 4435 阅读 · 3 评论 -
scala下串行实现em算法
本人编写的一维em算法初学em算法时被各种公式吓到,学的过程也不是很顺利(本人数学渣渣),好不容易弄懂了大概,现在来编写个程序来检验下import scala.mathobject Main { val data=Array(1.0,1.3,2.2,2.6,2.8,5.0,7.3,7.4,7.5,7.7,7.9)//点的数据,这里数据只要一维,当然可以为n维 var means=原创 2016-12-22 22:35:19 · 749 阅读 · 1 评论