机器学习-推荐系统

推荐系统
 
推荐系统
19444人在进行视频或语音聊天
62.5万部优酷土豆视频被观看
Facebook共产生701,389账号登陆
App Store上已有51,000个app被下载
。。。
 
推荐系统
 
推荐系统
 
推荐系统
 
协同过滤
如果你现在想看个电影,但你不知道具体看哪部,你会怎么做?
如何确定一个用户是不是和你有相似的品位?
如何将邻居们的喜好组织成一个排序的目录?
 
协同过滤
1.收集用户偏好
2.找到相似的用户或物品
3.计算推荐
要实现协同过滤,需要的步骤?
 
协同过滤
 
相似度计算
 
相似度计算
欧几里德距离(Euclidean Distance)
Cosine 相似度(Cosine Similarity)
皮尔逊相关系数(Pearson Correlation Coefficient)
 
相似度计算
皮尔逊相关系数(Pearson Correlation Coefficient)
协方差
皮尔逊相关系数
Pearson相关系数是用协方差除以两个变量的标准差得到的
 
相似度计算
皮尔逊相关系数
 
相似度计算
邻居的选择
A.固定数量的邻居
B.基于相似度门槛的邻居
 
协同过滤
基于用户的协同过滤
 
协同过滤
基于用户的协同过滤要解决的问题
已知用户评分矩阵Matrix R(一般都是非常稀疏的)
推断矩阵中空格empty cells处的值
 
协同过滤
UserCF存在的问题issues
对于一个新用户,很难找到邻居用户。
对于一个物品,所有最近的邻居都在其上没有多少打分。
 
协同过滤
基础解决方案
相似度计算最好使用皮尔逊相似度
考虑共同打分物品的数目,如乘上min(n,N)/N    n:共同打分数 N:指定阈值
对打分进行归一化处理
设置一个相似度阈值
 
相似度计算
基于用户的协同过滤为啥不流行?
1.稀疏问题
2.数百万的用户计算,这量?
3.人是善变的
 
协同过滤
基于物品的协同过滤
 
协同过滤
基于物品的协同过滤优势!
计算性能高,通常用户数量远大于物品数量
可预先计算保留,物品并不善变
 
协同过滤
r_51 = (0.41*2 + 0.59*3)/(0.41 + 0.59) = 2.6
 
协同过滤
用户冷启动问题
引导用户把自己的一些属性表达出来
利用现有的开放数据平台
根据用户注册属性
推荐排行榜单
 
协同过滤
物品冷启动问题
文本分析
主题模型
打标签
推荐排行榜单
 
协同过滤
 
协同过滤
基于用户的推荐
实时新闻
突然情况
基于物品的推荐
图书
电子商务
电影
。。。
 
隐语义模型
隐语义模型
从数据出发,进行个性化推荐
用户和物品之间有着隐含的联系
隐含因子让计算机能理解就好
将用户和物品通过中介隐含因子联系起来
 
隐语义模型
隐语义模型
分解
组合
 
隐语义模型
隐语义模型
 
隐语义模型
隐语义模型求解
梯度下降方向:
迭代求解:
 
隐语义模型
隐语义模型负样本选择
对每个用户,要保证正负样本的平衡(数目相似)
选取那些很热门,而用户却没有行为的物品
对于用户—物品集K {(u,i)}
其中如果(u, i)是正样本,则有
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
本教程为官方授权出品伴随着大数据时代的到来,作为发掘数据规律的重要手段,机器学习已经受到了越来越多的关注。而作为机器学习算法在大数据上的典型应用,推荐系统已成为各行业互联网公司营销体系中不可或缺的一部分,而且已经带来了真实可见的收益。目前,推荐系统机器学习已经成为各大公司的发力重点,众多知名公司(如亚马逊、netflix、facebook、阿里巴巴、京东、腾讯、新浪、头条等)都在着眼于将蕴含在庞大数据中的宝藏发掘出来,懂机器学习算法的大数据工程师也成为了新时代最紧缺的人才。精心打造出了机器学习推荐系统课程,将机器学习理论与推荐系统项目实战并重,对机器学习推荐系统基础知识做了系统的梳理和阐述,并通过电影推荐网站的具体项目进行了实战演练,为有志于增加大数据项目经验、扩展机器学习发展方向的工程师提供更好的学习平台。本课程主要分为两部分,机器学习推荐系统基础,与电影推荐系统项目实战。第一部分主要是机器学习推荐系统基础理论的讲解,涉及到各种重要概念和基础算法,并对一些算法用Python做了实现;第二部分以电影网站作为业务应用场景,介绍推荐系统的开发实战。其中包括了如统计推荐、基于LFM的离线推荐、基于模型的实时推荐、基于内容的推荐等多个模块的代码实现,并与各种工具进行整合互接,构成完整的项目应用。通过理论和实际的紧密结合,可以使学员对推荐系统这一大数据应用有充分的认识和理解,在项目实战中对大数据的相关工具和知识做系统的回顾,并且可以掌握基本算法,入门机器学习这一前沿领域,为未来发展提供更多的选择,打开通向算法工程师的大门。谁适合学:1. 有一定的 Java、Scala 基础,希望了解大数据应用方向的编程人员2. 有 Java、Scala 开发经验,了解大数据相关知识,希望增加项目经验的开发人员3. 有较好的数学基础,希望学习机器学习推荐系统相关算法的求职人员

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值