推荐系统实践-阅读笔记4

一. 隐语义模型

latent factor model
算法理论
对于某个用户,首先得到他的兴趣分类,再从分类中挑选他可能喜欢的物品
基于用户行为的自动聚类
P83 迭代优化P Q两个参数
(负样本采集问题: 热门商品却没有被用户喜欢的商品作为该用户的负样本)
重要的参数有:
1.隐藏的特征个数F
2.学习速率alpha
3.正则化参数lamba
4.负样本/正样本比例ratio
缺点:
雅虎的首页推荐。很难做到实时推荐,因为需要反复的迭代
e.g. 新闻推荐的冷启动问题非常明显

#二. 基于二分图的模型
一边的节点是用户,一边的节点是物品。连接边代表两者之间有联系
相关性评价指标:
1.两个顶点之间很多路径相连
2.两个顶点之间的路径长度比较短
3.两个顶点之间的路径不经过出度比较大的顶点 (避开用户活跃度高 或者 热门的商品)
随机游走的personalRank
P92
==> 矩阵形式的PersonalRank
P94

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值