一 含义
个性化推荐,给每个人推荐不一样的内容。
协同过滤:
1.如何确定一个用户是不是和我是相似的
2.如何对找到的人喜欢看的东西的排行
实习协同过滤的步骤:
1.收集用户偏好
2.找到相似的用户或者物品
3.计算推荐
相似度计算:
欧几里德距离(Euclidean Distance):距离,相似度
皮尔逊相关系数(Pearson Correlation Coefficient):协方差【-1,+1】,皮尔逊相关系数
Cosine相似度
邻居的选择
A.固定数量的邻居
B.基于相似度门槛
协同过滤:
基于用户的协同过滤:时事新闻,突发情况
基于物品的协同过滤:图书,电子商务,电影
基于物品的协同过滤的优势:
计算性能高,通常用户的数量远小于物品数量
可预先计算保留,物品并不善变
用户能启动问题:
引导用户把自己的一些属性表达出来
利用
隐语义模型
从数据出发,进行个性化推荐
用户
隐语义模型求解
隐语义模型参数选择:
1.隐特诊的个数F,通常F=100
2.学习速率alpha,别太大
3.正则化参数lambda,别太大
4.负样本/正样本比例 ratio
评估指标
1.准确率:RMSE
2.召回率:Recall
3.覆盖率:Coverage
4.多样性:Diversity