- 博客(6)
- 资源 (2)
- 收藏
- 关注
原创 spark官方文档
保存一下 http://www.apache.wiki/pages/viewpage.action?pageId=2883613
2016-12-26 20:39:06 502
原创 詹森不等式证明
詹森不等式是对凸函数的一个推导,由2推导到n凸函数性质:f(x)的二阶导数大于0,也就是f''(x)>0,在xf(ax+(1-a)y)证明:f(ax+(1-a)y)ax+(1-a)y-x=(1-a)(y-x)>0所以 x有x由拉格朗日中值定理有(f(ax+(1-a)y)-f(x))/((1-a)(y-x))=f'(z1)变形为:f(ax+(1-a)y)-f(x)
2016-12-23 13:21:38 11931
原创 先验概率与后验概率与似然估计
刚开始学习时一直弄不懂先后的概念,看了别人的博客明白了,现在我想以自己的语言总结一下(http://blog.csdn.net/tianguokaka/article/details/7704036#comments 优秀的博客)看官方语言的数学化解释实在无语,很多博客几乎都是照搬数学定义,渣渣没有数学大神那么牛,就以自己的语言表达一下条件概率:P(A|B)表示A在B发生的情况下的概率
2016-12-23 10:23:40 608
原创 scala下串行实现em算法
本人编写的一维em算法初学em算法时被各种公式吓到,学的过程也不是很顺利(本人数学渣渣),好不容易弄懂了大概,现在来编写个程序来检验下import scala.mathobject Main { val data=Array(1.0,1.3,2.2,2.6,2.8,5.0,7.3,7.4,7.5,7.7,7.9)//点的数据,这里数据只要一维,当然可以为n维 var means=
2016-12-22 22:35:19 733 1
原创 spark下实现并行kmeans算法
相比于本人上篇博客中scala实现的串行kmeans而已,这次的优点体现在并行的计算,并同时运行多组kmeans算法(选取不同的初值),选择其中效果最好的作为结果输出作为一个初学者,这次的编程让我初步的体会到了函数式编程的魅力,让我见识到了并行计算,学习的道路还有很长啊package zzlimport org.apache.spark.mllib.linalg.Vectorim
2016-12-22 19:33:45 4417 3
原创 scala实现Kmeans算法
好久没有写博客了,虽然并没有多少人看。kmeans的思想大家自己去查找,我就不一一叙述了。kmeans之所以不能达到全局最优,是因为他的cost函数是一个非凸的函数,找不到最低点那个位置。kmeans的初始位置很重要,本片博客采取的就是最基本的随机生成初始中心点(我很好奇,有些人的代码就是随机生成n和点,都不带判重的),比较 好的生成算法是kmeans++,保证初始点间的距离最远。这是我初学sca
2016-12-15 11:57:09 3796
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人