由来
AutoRec是在2015年由澳大利亚国立大学提出的,它将自编码器的思想和协同过滤结合,提出了一种单隐层神经网络推荐模型。
模型结构
原理
自编码是指能够自动完成数据编码的模型,无论是图像,音频,还是数据都可以转换成向量的形式,假设输入数据为r
自编码的重建函数为
当输入物品i的评分向量为r(i)时, 模型的输出向量h(r(i);θ)就是所有用户对物品i的评分预测。那么,其中的第w维就是用户u对物品i的预测R即预测函数为
AutoRec的目标是学习一个模型能使得输出尽可能接近输入,选用平方误差作为loss function后目标为
模型的优化目标
其中
后一项为防止过拟合加入的正则项。需要注意的是第一项里在计算loss只在观测到的数据上计算。未观测到的missing value在初始时赋一个默认值,比如1-5分的打分体系里统一给3。
在使用模型做预测时,直接将模型对input重建后的新向量里对应位置的值认为是预测值,即
存在的问题:
在数据很稀疏的情况下用AutoRec去学习的效果会不理想,数据里噪声太大,在CF里存在的困境同样存在。