(TODO)Empirical Analysis of Predictive Algorithm for Collaborative Filtering

论文《Empirical Analysis of Predictive Algorithm for Collaborative Filtering》总结

paper

1. 摘要

只分析了基于用户的协同过滤算法(Memory-Based and Model-Based Algorithms); 实验分析了显式和隐式数据(Explicit and Implicit Data)

Memory-based algorithms operate over the entire user database to make predictions. Model-based collaborative filtering, in contrast, uses the user database to estimate or learn a model, which is then used for predictions.

2. Memory-based algorithms

2.1 基本定义

基本公式

Pa,j=v¯a+κi=1Nw(a,i)(viv¯i)(1)
w(a,i) 为用户a和用户i的关系权重。
为什么要减去用户平均值? 系数干什么用? 计算用户之间的权重用什么方法?

2.2 Correlation

w(a,i)=j(va,jv¯a)(vi,jv¯i)j(va,jv¯a)2(vi,jv¯i)2(2)
注: j只是用户a和用户i的投票(vote)项目交集

2.3 Vector Similarity

w(a,i)=jva,jkIav2a,kvi,jkIiv2i,k(3)
注: j只是用户a和用户i的投票(vote)项目交集, 但是与Correlation不同的是分母的项目是用户所有投票项目

2.4 Extension to Memory-based algorithms

2.4.1 Default Voting

w(a,i)=(n+k)(jva,jvi,j+kd2)(jva,j+kd)(jvi,j+kd)((n+k)(jv2a,j+kd2)(jva,j+kd)2)((n+k)(jv2i,j+kd2)(jvi,j+kd)2)(4)

注:d是默认填充值;n是用户a和用户i的投票项目并集; k是额外填充项目个数
这个思想为什么只在公式(2)上面改进?

2.4.2 Inverse User Frequency

借鉴Inverse Item Frequency思想[1]

The idea is to reduce weights for commonly occurring words, capturing the intuition that they are not as useful in identifying the topic of a document, while words that occur less frequently are more indicative of topic.

w(a,i)=jfjjfjva,jvi,j(jfjva,j)(jfjvi,j)UV

U=jfj(jfjv2a,j(jfjva,j)2)

V=jfj(jfjv2i,j(jfjvi,j)2)

注: 这个思想为什么只在公式(2)上运用?

3. Model-Based Algorithms

3.1 基本定义

pa,j=E(va,j)=i=0mPr(va,j=i|va,k,kIa)i(5)

注:用户的投票分数从0~m, 为整数

3.2 Cluster Model

TODO

没看懂,2017:10:20:20:29

3.3 Bayesian Network Model

TODO

没看懂,2017:10:20:20:29

Experiment

TODO

因为3.2和3.3没看懂, 所以等弄懂后再看

References

[1] Introduction to Modern Information Retrieval, Salton and McGill, 1983

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值