矩阵补充（matrix completion）

最新推荐文章于 2024-08-21 21:14:30 发布

Zhanghang Chan13

最新推荐文章于 2024-08-21 21:14:30 发布

阅读量1.7k

点赞数

文章标签：矩阵机器学习深度学习推荐算法人工智能

本文链接：https://blog.csdn.net/qq_54432917/article/details/129919094

版权

矩阵补充是一种向量召回通道，通过用户ID和物品ID的embedding向量内积预估用户兴趣。然而，矩阵补充在实践中往往逊色于双塔模型，因为它忽略了丰富的用户和物品属性。模型训练基于用户-物品兴趣分数的平方误差，目标是最小化预测误差。矩阵补全的意义在于完成矩阵以实现推荐，但其局限性在于简单使用两个embedding层且训练效果不佳。矩阵分解是矩阵补全的一种手段，可用于估计和填充缺失值。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

这篇文章介绍矩阵补充（matrix completion），它是一种向量召回通道。矩阵补充的本质是对用户 ID 和物品 ID 做 embedding，并用两个 embedding 向量的內积预估用户对物品的兴趣。值得注意的是，矩阵补充存在诸多缺点，在实践中效果远不及双塔模型。

上篇文章介绍了embedding，它可以把用户ID和物品ID 映射成向量，这张图就是基于embedding做推荐的。模型的输入是用户ID和物品ID，模型的输出是一个实数，是用户对于物品兴趣的预估值，这个数越大表示用户对物品越感兴趣。这张图的左边有一个embedding层，把一个用户ID映射到一个向量，记作a，这个向量是对用户的表征。上篇文章讲了，embedding层的参数是一个矩阵，矩阵中列的数量是用户数量，每一列都是图中a这么大的向量。embedding层的参数数量=用户数量*向量a的大小。右边结构也是一个embedding层，把一个物品ID映射到一个向量，记作b，这个向量是对物品的表征。因为embedding层的参数是一个矩阵，矩阵中列的数量是物品数量，每一列都是图中b这么大的向量。embedding层的参数数量=物品数量*向量b的大小。对向量a和向量b求内积得到一个实数作为模型的输出，这个模型就是矩阵补充模型。

问题来了，这么训练这个模型呢？

数据集：使用一个（用户ID,物品ID，兴趣分数）三元组集合

详细解释一下这个公式，这里的是训练集中的一条数据，意思是用户u对物品i的真实兴趣分数y，是向量a和b的内积，它是模型对兴趣分数的预估，反映的是第u号用户有多喜欢第i号物品，是真实兴趣分数y与预估值之间的差，我们希望这个差越小越好，干脆取差的平方，差的平方越小，证明预估值越接近真实值y。对每一条记录的差的平方求和，作为优化的目标函数，对目标函数求最小化。

刚才拿绿色位置的数据作为数据集训练出了模型，这个模型又返回来预测出所有灰色位置的分数，即把矩阵中空的位置补全。这就是模型叫矩阵补充的原因。

那么补全到底有什么意义呢？把矩阵补全后就可以做推荐。选出一行中分数最高的几个物品推荐给这一行的这个用户。是不是看起来很高级？其实这个方法是有很大缺点的，它仅仅用了2个embedding层，把用户ID和物品ID 映射成2个向量，仅此而已。以小红书为例，小红书会记录物品属性（类目，关键词，地理位置，作者信息）和用户属性（性别，年龄，地理位置，感兴趣的类目），这个方法根本没用到这些信息，如果我们能把这些信息应用到召回中，召回会做的更加精准。其次，这个方法做训练的效果很不好，因为用内积不如用余弦相似度，用平方损失（做回归）不如用交叉熵损失（做分类）。

总结一下矩阵补充：