协同过滤详见:https://blog.csdn.net/qq_38375203/article/details/124518238?spm=1001.2014.3001.5502
一、协同过滤的下一步发展
协同过滤是一个非常直观且可解释性很强的模型,但是它并不具备泛化的能力。或者说协同过滤无法将两个物品相似这一信息转换到别的物品上。这就会产生头部效应,即热门的物品会有着丰富的矩阵向量参数,而冷门的物品的矩阵向量就很稀疏,这就导致了冷门物品很少被推荐,这就是我们常说的冷启动问题。
为了解决这个问题,增加模型的泛化能力,于是提出了矩阵分解的技术
二、矩阵分解原理
矩阵分解期望为每一个用户和视频生成一个隐向量,将用户和视频定位到隐向量的表示空间上,距离相近的用户和视频表明兴趣特点相似。那么如何得到这个隐向量呢?在矩阵分解算法框架下,用户和物品的隐向量是通过分解协同过滤算法生成的共现矩阵得到的。如图所示
矩阵分解算法将m×n的共现矩阵R分解为m×k的用户矩阵U和k×n的物品矩阵V,其中m是用户数量,n是物品数量,k是隐向量的维度。k的大小决定了隐向量表达能力的强弱。k的取值越小,