机器学习(5) 推荐矩阵分解(Matrix Factorization)

最新推荐文章于 2024-03-18 17:41:57 发布

GZHermit

最新推荐文章于 2024-03-18 17:41:57 发布

阅读量2.5w

点赞数 10

分类专栏：机器学习

本文链接：https://blog.csdn.net/GZHermit/article/details/73920755

版权

机器学习专栏收录该内容

9 篇文章 0 订阅

订阅专栏

稍微看了一些关于推荐方面的资料，做一下简单的总结。

矩阵分解

矩阵分解的思想很简单，对于用户-物品这个评分矩阵 $R$ ，我们可以将其分解为用户-特性矩阵，以及特性-物品矩阵。这样做的好处有两点：
1. 得到了用户的偏好，以及物品的特性
2. 降低了矩阵的维度。
举个例子，比如音乐推荐。我们比如有3个用户(u表示)，4首音乐(m表示)。

u 1 u 2 u 3 m 1 w u m 21 m 2 w u m 12 m 3 w u m 32 m 4

$\begin{array}{c|cc} & m_1 & m_2 & m_3 & m_4 \\ \hline u_1 & & w_{12}^{um} & &\\ u_2 & w_{21}^{um} & & &\\ u_3 & & & w_{32}^{um} & \end{array}$
可以想到，在真实的场景中，这个矩阵是极其稀疏的，对于庞大的音乐库来说，每个用户听过的曲目都是极小的一部分。并且由于用户数量和音乐数量极大，所以这个

R $R$ 实际上是一个极大的矩阵。
现在假设音乐的风格有以下几类：摇滚，重金属，民谣，说唱，轻音乐。分别用

s1,s2,s3,s4,s5 ${s_1,s_2,s_3,s_4,s_5}$ 来表示。那么我们希冀得到用户对于风格偏好的矩阵

Q $Q$ ，以及每个风格在歌曲中所占比重的矩阵

P $P$ 。

u 1 u 2 u 3 s 1 w u s 11 w u s 21 w u s 31 s 2 w u s 12 w u s 22 w u s 32 s 3 w u s 13 w u s 23 w u s 33 s 4 w u s 14 w u s 24 w u s 34 s 5 w u s 15 w u s 25 w u s 35 s 1 s 2 s 3 s 4 s 5 m 1 w s m 11 w s m 21 w s m 31 w s m 41 w s m 51 m 2 w s m 12 w s m 22 w s m 32 w s m 42 w s m 52 m 3 w s m 13 w s m 23 w s m 33 w s m 43 w s m 53 m 4 w s m 14 w s m 24 w s m 34 w s m 44 w s m 54

$% outer vertical array of arrays 外层垂直表格 \begin{array}{c} % inner horizontal array of arrays 内层水平表格 \begin{array}{cc} % inner array of minimum values 内层"最小值"数组 \begin{array}{c|cccc} & s_1 & s_2 & s_3 & s_4 & s_5 \\ \hline u_1 & w_{11}^{us} & w_{12}^{us} & w_{13}^{us} & w_{14}^{us} & w_{15}^{us} \\ u_2 & w_{21}^{us} & w_{22}^{us} & w_{23}^{us} & w_{24}^{us} & w_{25}^{us} \\ u_3 & w_{31}^{us} & w_{32}^{us} & w_{33}^{us} & w_{34}^{us} & w_{35}^{us} \\ \end{array} & % inner array of maximum values 内层"最大值"数组 \begin{array}{c|cccc} & m_1& m_2 & m_3 & m_4\\ \hline s_1 & w_{11}^{sm} & w_{12}^{sm} & w_{13}^{sm} & w_{14}^{sm}\\ s_2 & w_{21}^{sm} & w_{22}^{sm} & w_{23}^{sm} & w_{24}^{sm}\\ s_3 & w_{31}^{sm} & w_{32}^{sm} & w_{33}^{sm} & w_{34}^{sm}\\ s_4 & w_{41}^{sm} & w_{42}^{sm} & w_{43}^{sm} & w_{44}^{sm}\\ s_5 & w_{51}^{sm} & w_{52}^{sm} & w_{53}^{sm} & w_{54}^{sm} \end{array} \end{array} % 内层第一行表格组结束 \\ \end{array}$
通过这两个矩阵，我们就可以计算出

ui $u_i$ 对

mi $m_i$ 的评分：

w u m i j = \sum h = 1 5 w u s i h w s m h j, 5 是 音 乐 风 格 种 类 的 数 量

$w_{ij}^{um} = \sum_{h=1}^{5}w_{ih}^{us}w_{hj}^{sm},5是音乐风格种类的数量$
通过这种方式，我们即可补全矩阵R。

现在的问题是，如何求出矩阵 $Q$ 和 $P$ 呢？
很简单的做法，我们可以通过迭代的方式，逐步使得 $\tilde{R}=QP^T$ 与R之间的距离变小。设置loss函数，然后使用梯度下降法。loss函数设置如下：

a r g min Q, P = L (R, Q P T) + λ (| | Q | | 2 F + | | P | | 2 F)

$\begin{equation} arg\ \min\limits_{Q,P} =\mathcal{L}(R,QP^T) +\lambda(||Q||_F^2 + ||P||_F^2) \end{equation}$
其中

L(⋅,⋅) $\mathcal{L}(\cdot,\cdot)$ 是衡量两个矩阵之间距离的loss函数，而

(||Q||2F+||P||2F) $(||Q||_F^2 + ||P||_F^2)$ 则是正则项，用来约束参数，避免过拟合。

||⋅||F $||\cdot||_F$ 是F-范数。这就是最基本的矩阵分解的思想和做法，后面有更进一步，比如考虑多种因素的，引入历史信息的，引入时间信息的。可以参见这篇博客。

F-范数：

设 $A=(a_{ij})_{n*n} \in C^{n*n}$ ，令

| | A | | F = (\sum i = n n \sum i = n n | a i j | 2) 1 2

$||A||_F = \big(\sum_{i=n}^n\sum_{i=n}^n|a_{ij}|^2\big)^{\frac{1}{2}}$

||A||F $||A||_F$ 是一种与向量的2-范数

||x||2 $||x||_2$ 相容的方针范数，称其为方阵A的Frobenius范数，简称F-范数。看这个形式，其实跟L2范数的计算方式一模一样嘛。但是L2范数是没有限制矩阵的形状的，而F范数必须是个方阵。
关于L2范数为什么可以起到正则化的效果，可以参见这篇博客，个人觉得讲的非常好，浅显易懂。佩服~

GZHermit

关注

10
点赞
踩
36

收藏

觉得还不错? 一键收藏
2
评论
机器学习(5) 推荐矩阵分解(Matrix Factorization)

稍微看了一些关于推荐方面的资料，做一下简单的总结。推荐任务定义：在一个标准推荐任务中，我们有mm个用户(user)，nn个物品(item)，以及一个稀疏评分矩阵R(R∈Rm∗n)R(R\in R^{m*n})。RR中每个RijR_{ij}表示用户ii对于物品jj的评分。如果Rij≠0R_{ij} \neq 0，那么说明用户ii有对物品jj的评分，反之则没有。每一个用户ii可以
复制链接

扫一扫