机器学习
廖振钦
这个作者很懒,什么都没留下…
展开
-
基于ALS算法的简易在线推荐系统
继前期完成广义线性模型的在线流式机器学习的代码后,我们对spark的mllib中的推荐系统这一部分比较感兴趣,因为推荐系统这一部分在现实生活中也非常实用,尤其是基于地理位置的在线推荐系统目前非常火热,很多商业软件如大众点评,淘点点等都希望能根据用户以往的一些行为和当前所处的地理位置给用户做出最佳的推荐,给用户带来意想不到的惊喜。 在推荐系统领域,目前市面上中文的参考书并不多,我们主要转载 2014-11-22 16:20:39 · 1124 阅读 · 0 评论 -
在线的PCA算法
1、离线PCA PCA是一种最基本的降维算法,在机器学习中被广泛使用。它是一种线性降维,其基本思想是: 对大量的数据,找到其主成分,主成分的个数小于原始数据的维度,然后将原始数据投影到主成分张成的空间中, 可减小数据的维度。 从上面的描述我们可以总结出: 1. 原始数据(x1,x2,x3,…,xn)(列向量)是一个n维的数据,它是在n个基(转载 2014-11-22 16:26:59 · 1408 阅读 · 0 评论 -
协同过滤算法简析
推荐系统必须有快速反应能力,众所周知,现在网络上充满着各种各样的信息,而且数量相当庞大,并且还在以相当惊人的速度增长,如何在海量的信息中快速的找到我们所需要的信息并快速的反馈给用户,是互联网推荐系统需要考虑的一个十分重要的问题。 推荐系统中最核心和关键的部分就是使用的推荐算法,其在很大程度上决定了推荐系统性能的优劣。推荐算法大致可以分为以下几类:1、基于内容的推荐算法(content-b转载 2014-11-22 16:25:03 · 590 阅读 · 0 评论