(1)怎么去理解呢?
协同过滤是利用集体智慧的一个典型方法。
(PS,协同过滤是推荐的核心算法,即集体智慧和推荐是关系的,个中原理参见上面所说的。)
要理解什么是协同过滤 (Collaborative Filtering, 简称 CF),首先想一个简单的问题:
如果你现在想看个电影,但你不知道具体看哪部,你会怎么做?
大部分的人会问问周围的朋友,看看最近有什么好看的电影推荐,而一般更倾向于从口味比较类似的朋友那里得到推荐。这就是协同过滤的核心思想。
核心原理:协同过滤一般是在海量的用户中发掘出一小部分和你品位比较类似的,在协同过滤中,这些用户成为邻居,然后根据他们喜欢的其他东西组织成一个排序的目录作为推荐给你。
(2)会遇到什么问题?
当然其中有一些核心的问题:
如何确定一个用户是不是和你有相似的品位?(数据,动作,用户/内容画像)
如何将邻居们的喜好组织成一个排序的目录?(召回,排序,推荐)
如同第一章所说,同样与集体智慧PK。可以发现:
协同过滤相对于集体智慧而言,它从一定程度上保留了个体的特征,就是你的品位偏好,所以它更多可以作为个性化推荐的算法思想。
(补充2:所以可以想象,这种推荐策略在 移动互联网 的长尾中是很重要的,将大众流行的东西推荐给长尾中的人怎么可能得到好的效果,所以回到推荐系统的一个核心问题:了解你的用户,然后才能给出更好的推荐。)