【推荐系统】AutoRec:当自编码器遇见协同过滤

最新推荐文章于 2022-05-08 20:43:59 发布

布纸所云

最新推荐文章于 2022-05-08 20:43:59 发布

阅读量1k

点赞数

分类专栏：推荐系统文章标签：深度学习推荐系统

本文链接：https://blog.csdn.net/XindiOntheWay/article/details/105472610

版权

10 篇文章 3 订阅

订阅专栏

将自编码器(AutoEncoder)的思想和协同过滤结合：

目标
- 自编码器的作用是将向量 $\bm{r}$ 作为输入，通过重建函数，使得得到的输出向量尽可能接近本身
定义
- 设自编码器的重建函数为 $h(\bm{r};\theta)$
- 目标函数如下，其中 $S$ 为所有输入向量的集合
  $min_{\theta}\sum_{\bm{r}\in S}||\bm{r}-h(\bm{r};\theta)||_2^2$
作用
- 完成数据压缩和降维：重建函数的参数数量远小于输入向量的维度
- 泛化：输出向量不完全等同于输入向量，具备一定的缺失维度的预测能力

假设有 $m$ 个用户， $n$ 个物品
$R_{m\times n}$ 为用户的评分矩阵
- 每个用户 $u\in U = \{1,\cdots, m\}$ 可以被该用户对于 $n$ 个物品的评分表示： $\bm{r}^{u} = (R_{u1},R_{u2},\cdots,R_{un})$
- 每个物品 $\in I={1,\cdots,n}$ 可以被该物品得到的 $m$ 个用户的评分表示为： $\bm{r}^{(i)}=(R_{1i}, R_{2i}, \cdots, R_{mi})$
AutoRec解决的问题就是
- 设计一个 $u s e r - b a s e d$ 或者 $i t e m - b a s e d$ 的自编码器:
1. 将 $\bm{r}^{u}$ / $\bm{r}^{i}$ 映射到一个低维的隐含空间
2. 再在输出空间重建 $\bm{r}^{u}$ / $\bm{r}^{i}$
- 通过自编码器重建的输出向量，来预测某个用户对于某个物品的评分

$i t e m - b a s e d$ 的 $A u t o R e c$ 结构如下图所示：

在这里插入图片描述

$r^{(i)}$ 为输入
$h(\bm{r};\theta)$ 为网络输出的重构之后的 $r^{(i)}$ ：
$h(\bm{r};\theta)=f(W\cdot g(V\bm{r}+\bm{\mu}) +\bm{b})$
- $f(\cdot)$ , $g(\cdot)$ 为激活函数， $\theta = {W, V,\bm{\mu}, \bm{b}}$
- 隐层的维度为 $k$
- $\in R^{m\times k}$ , $\in R^{k\times m}$
- $\bm{\mu},\bm{b}$ 为 $b i a s$ ， $\bm{\mu} \in R^{k}$ , $\bm{b} \in R^{m}$
为防止过拟合，加入 $L 2$ 正则化，目标函数如下：
$min_{\theta}\sum_{i=1}^{n}||r^{(i)}-h(r^{(i)};\theta)||_{o}^{2} + \frac{\lambda}{2}\cdot(||W||^2_F+||V||_F^2)$

当输入物品 $i$ 的评分向量为 $\bm{r}^{(i)}$ ，模型的输出向量 $h(\bm{r^{(i)}};\theta)$ 就是所有用户对于物品 $i$ 的评分预测
第 $u$ 维就是用户 $u$ 对于物品 $i$ 的预测 $\hat{R}_{ui}$ :
$\hat{R}_{ui} = (h(\bm{r^{(i)}};\theta))_u$
相较于 $i t e m - b a s e d$ $A u t o R e c$ ， $u s e r - b a s e d$ $A u t o R e c$ 的优势在于只需要一次模型推断就可以重建用户对所有物品的评分向量，但是用户向量的稀疏性可能会影响模型效果

关注