协同过滤的局限性
协同过滤非常直观,而且可解释性强,但是它仍然具有很多的局限性,比如它的泛化能力比较差,协同过滤无法将两个物品相似这一信息推广到其他物品的相似度计算上。这就到这了一个严重的问题,热门物品具有很强的头部效应,容易跟大量的商品产生相似度,而长尾商品,由于其特征向量稀疏,很少与其他物品产生相似度,导致被推荐的可能性很小。但是去发掘长尾商品,增加长尾被推荐的可能性却是推荐系统最重要的目标之一。这其实也可以被视为是协同过滤的天然缺陷,本身无论是基于用户还是基于商品,协同过滤对稀疏向量的处理本身就很弱,所以头部效应才会这么明显。
也正是因此,才有矩阵分解技术MF被提了出来,它可以解决上述问题,并且增加泛化能力。这个我们放到下篇文章来讲。
协同过滤还有其他的局限性,比如,CF方法其实只是利用了用户和物品之间的交互信息,却无法去考虑以及综合其他的语义信息,比如年龄,性别,商品描述,商品分类等等。这会导致对数据的挖掘不够彻底,造成信息的遗漏。
正是因为这个原因,逻辑回归模型为核心的模型才会发展起来,能够综合不同类型特征的机器学习模型才能够大放异彩,我们同样放到后面来讲。
————————————————
版权声明:本文为CSDN博主「JinyuZ1996」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/qq_39381654/article/details/108910227