《AutoEmb: Automated Embedding Dimensionality Search in Streaming Recommendations》论文阅读笔记
- 背景:
基于深度学习的推荐系统,能够有效获得用户项目之间的非线性关系,并学
习他们的特征。主要由三部分组成:
(1) 嵌入层:将用户项目特征从高维空间映射到低维空间中;
(2) 隐藏层:对输入特征进行非线性变换;
(3) 输出层:基于特征进行预测 - 已有研究:
为用户,项目嵌入向量预定义一个固定统一的维数。重点关注隐藏层和输出层。 - 存在问题:
(1) 实际中存在大量用户,项目,并且流行度会动态变化,因此嵌入向量大小的选择是RS中的问题。
(2) 对于第一个隐藏层,很难处理嵌入层的不同维数。 - 本文:
基于AutoML的端到端框架,以一种自动动态变化的方式根据流行度改变嵌入向量的维数。
- 详细:
规模小使用短的嵌入向量,随着规模的增加,使用长的嵌入向量。
基本的处理方法:将不同的嵌入维数转换为相同的(使用全连接层&#x