Machine Learning
白 杨
这个作者很懒,什么都没留下…
展开
-
拉格朗日乘子法(有约束优化问题)
拉格朗日乘子法(Lagrange Multiplier)和KKT(Karush-Kuhn-Tucker)条件是求解约束优化问题的重要方法,在有等式约束时使用拉格朗日乘子法,在有不等约束时使用KKT条件。前提是:只有当目标函数为凸函数时,使用这两种方法才保证求得的是最优解。对于无约束最优化问题,有很多经典的求解方法,参见无约束最优化方法。拉格朗日乘子法先来看拉格朗日乘子法是什么,再讲为什么。minf(原创 2015-10-26 21:13:01 · 9903 阅读 · 3 评论 -
分布式图并行计算框架:PowerGraph
1. About Joseph E.Conzalez首先关于约瑟夫,他目前在伯克利AMP实验室做博士后,这是他博客的一个截图。在他博客中写道,下个月即2016年1月份将要当任伯克利的助理教授。在看了他的简历后,发现他居然也是Spark Graphx的第一作者,并且Graphx这篇论论文也是发表在OSDI上,非常牛逼!戳这里,是他的博客地址。2. About OSDI第二个要介绍的是关于OSDI这个会原创 2015-12-16 22:39:01 · 23186 阅读 · 2 评论 -
基于近邻用户协同过滤算法的音乐推荐系统
0. 摘 要基于近邻用户的协同过滤音乐推荐系统,主要是将与目标用户有相同行为和兴趣爱好的用户,形成一个最近邻的推荐群组,从最近邻推荐群组中产生最终的目标用户推荐列表。该推荐系统通过网络爬虫获取虾米音乐网站真实未脱敏用户的行为信息,采用余弦相似度作为求解相似矩阵的算法,从而为目标用户推荐喜欢的音乐,达到推荐目标。1. 引言1.1 研究背景人类已经进入信息爆炸的时代,面对这么庞大的信息,是很难进行人为筛原创 2016-03-03 11:04:12 · 19216 阅读 · 21 评论 -
PageRank算法原理剖析及Spark实现
1. 什么是PageRankPageRank对网页排名的算法,曾是Google发家致富的法宝。PageRank算法计算每一个网页的PageRank值,然后根据这个值的大小对网页的重要性进行排序。2. 简单PageRank计算首先,将Web做如下抽象:将每个网页抽象成一个节点;如果一个页面AA有链接直接链向BB,则存在一条有向边从AA到BB(多个相同链接不重复计算边)。因此,整个Web被抽象为一原创 2015-12-10 20:21:38 · 9990 阅读 · 5 评论 -
Zipf,Power-laws,Pareto分布
对于在对数坐标系中出现一条直线而言,三种分布都是可能的:Zipf,Power-laws和 Pareto。这三种分布都是用于描述同一种现象:大量事件是稀少的,而一些小事件确是很普遍的。 例如:成绩非常优异的学生是少数,但是成绩中等的学生却很多。(1)Zipf分布描述事件出现平率yy与其由下优先级r(Rank)r(Rank)之间的关系,按照Zipf模型,事件出现的平率与其优先级rr成反比:原创 2016-05-25 08:01:41 · 3373 阅读 · 0 评论