自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

原创 机器学习->推荐系统->基于图的推荐算法(PersonalRank)

本博文将介绍PersonalRank算法,以及该算法在推荐系统上的应用。 将用户行为数据用二分图表示,例如用户数据是由一系列的二元组组成,其中每个元组(u,i)表示用户u对物品i产生过行为。将个性化推荐放在二分图模型中,那么给用户u推荐物品任务可以转化为度量Uv和与Uv 没有边直接相连 的物品节点在图上的相关度,相关度越高的在推荐列表中越靠前。图中顶点的相关度主要取决与以下因素: 1)两个顶

2017-03-24 19:28:37 8452 6

原创 机器学习->推荐系统->利用用户标签数据

在之前的博文中介绍了三种方法给用户推荐物品。 1)UserCF:给用户推荐和他们兴趣爱好相似的其他用户喜欢的物品。 2) ItemCF:给用户推荐与他喜欢过的物品相似的物品。 3) LFM:通过一些特征来联系用户和物品,给用户推荐那些具有用户喜欢的特征的物品。 具体可以看我之前的博文。 本文我将自己实现两个算法,如有不对的地方还望指正。 本节咱们将讨论一种重要的特征表现形式–标签

2017-03-24 13:53:42 5662 6

原创 机器学习->推荐系统->冷启动问题

我们之前讨论推荐系统的UserCF算法和ItemCF等算法都是以拥有大量用户行为数据为先决条件,并以此对物品或者用户进行自动聚类。但是对于一个刚刚开始运行推荐系统的应用的网站来说,如何在没有大量用户行为数据的情况下设计个性化推荐系统并且让用户对推荐系统满意,从而愿意使用推荐系统,这就是冷启动问题。对于冷启动问题,一般分为三类: 一)用户冷启动:如何对新用户做个性化推荐。 二)物品冷启动:如何将新

2017-03-19 15:05:25 13510

原创 机器学习->统计学基础->贝叶斯估计,最大似然估计(MLE),最大后验估计(MAP)

在学习机器学习,推荐系统等上的众多算法思想时,以及在数学公式推到上面,避免不了许多统计学方面的知识,其中以贝叶斯,最大似然估计,最大后验估计为最常遇见,必须深刻掌握了解。首先讲讲贝叶斯估计(对比传统频率学来讲) 在我们传统的频率学来说,需要推断的参数theta是固定未知的,是个确定的值,而样本是随机的,所以频率派重点研究样本空间,大部分的概率计算都是针对样本X 的分布; 例如:有一个袋子,里面装

2017-03-17 10:15:11 7432 1

原创 机器学习->推荐系统->LFM

LFM(latent factor model)隐语义模型核心思想是通过隐含特征联系用户兴趣和物品。 相比USerCF算法(基于类似用户进行推荐)和ItemCF(基于类似物品进行推荐)算法;我们还可以直接对物品和用户的兴趣分类。对应某个用户先得到他的兴趣分类,确定他喜欢哪一类的物品,再在这个类里挑选他可能喜欢的物品。基于上面的思想,基于兴趣分类的方法大概需要解决3个问题: ①:如何对物品分类

2017-03-14 10:13:45 3627 3

原创 机器学习->推荐系统->itemCF算法

上一讲讲到userCF算法,该算法是根据用户之间相似度,来给目标用户推荐与他们相似用户产生过行为的物品。该算法在某些应用场景并不适用。首先随着网站用户数目越来越大,计算用户兴趣相似矩阵越来越困难,运算时间复杂度和空间复杂度和用户增长近似于平方关系。其次,基于用户的协同过滤很难对推荐结果作出解释。由此产生了基于物品的协同过滤(itemCF)给用户推荐和他们之前喜欢的物品相似的物品。不过ItemCF算法

2017-03-13 11:16:54 5872 1

原创 机器学习->监督学习->logistic回归,softMax回归

本篇博文来总结一下回归模型里面两个非常重要的模型。logistic回归softMAX回归Logistic回归logistics回归虽然有“回归”两字但是却是分类模型,并且是个二分类模型。logistics回归是个线性分类模型,有着线性的决策边界,但是有着非线性的激活函数去估计后验概率。下面就从数学层面讲讲logistics回归。 首先介绍下sigmoid函数 其函数图像: 显然sigmo

2017-03-06 11:59:25 4065

原创 机器学习->推荐系统->userCF算法

一: 推荐系统任务:联系用户和信息,一方面帮助用户发现对自己有价值的信息,另一方面让信息能够展现在对它感兴趣的用户面前,从而实现信息消费者和信息生产中的双赢。长尾理论:传统80/20(%80销售额来自于20%热门商品)原则在互联网加入下受到挑战。长尾商品销售额是个不容小觑的数字,也许会超过热门商品带来的销售额。热门商品代表绝大多数用户需求,而长尾商品代表一小部分用户个性化需求。因此要发掘长尾以提高

2017-03-05 22:26:38 2669 1

原创 机器学习->监督学习->线性回归(LASSO,Ridge,SGD)

本篇博文主要总结线性回归,线性回归虽然简单,但是却是很重要,我将沿着以下几个主题总结最小二乘法使用极大似然估计来解释最小二乘的解析式的求解过程线性回归的复杂度惩罚因子(LASSO,Ridge)梯度下降法实战最小二乘法线性回归,线性是指回归方程在空间中表现为直线形式,其决策边界是线性的.回归在数学上来说是给定一个点集,能够用一条曲线去拟合之,如果这个曲线是一条直线,那就被称为线性回归,基

2017-03-04 21:52:13 4598 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除