Embedding在推荐系统中的应用（DeepFM算法）

最新推荐文章于 2022-07-25 21:49:10 发布

风华正茂dd

最新推荐文章于 2022-07-25 21:49:10 发布

阅读量617

点赞数

分类专栏： BI商业智能

本文链接：https://blog.csdn.net/u013052732/article/details/119856091

版权

BI商业智能专栏收录该内容

24 篇文章 3 订阅

订阅专栏

一、DeepFM算法

DeepFM = FM + DNN：提取低阶(low order)特征 => 因子分解机FM 既可以做1阶特征建模，也可以做2阶特征建模提取高阶(high order)特征 => 神经网络DNN end-to-end，共享特征输入对于特征i，wi是1阶特征的权重， Vi表示该特征与其他特征的交互影响，输入到FM模型中可以获得特征的2阶特征表示，输入到DNN模型得到高阶特征。

二、推荐系统应用

在推荐系统中，可以通过Embedding向量进行快速召回向量化召回，通过模型来学习用户和物品的兴趣向量，并通过内积来计算用户和物品之间的相似性，从而得到最终的候选集（经典的Youtube召回模型）收集数据：神经网络需要大量的训练样本；数据处理：根据具体问题将数据按照embedding的场景标准进行处理训练weights：建立embedding模型训练weights；使用weights：使用Embedding weight进行recommendation和visualizations 推荐：通过内积计算用户与物品之间的相似度可视化，可以通过PCA进行可视化

三、使用近似最近邻查找加速

对于在线服务，有严格的性能要求（几十毫秒）。通过保存用户兴趣embedding和视频兴趣embedding，通过最近邻搜索的方法得到top N的结果代表算法是LSH，局部敏感Hash

如果将视频库中的每一个视频当作一个类别，那么在时刻t，对于用户U和上下文C，用户会观看视频i的概率为 u是用户的embedding（网络最后一个Relu激活函数的输出） vi是视频i的embedding 输入层的embedding分别是用户空间和Video空间的向量，最终的输出层，通过user embedding和全部video embedding矩阵进行点积（全联接层的线性变化），将两者转换到了同一空间，所以对于用户和视频来说，输出层的embedding是同一空间（可以理解是兴趣空间，二者的内积代表相似性）

四、Faiss工具

Faiss工具 FAIR（Facebook AI Research）团队开发的AI相似性搜索工具，处理大规模d维向量近邻检索的问题使用Faiss，Facebook 在十亿级数据集上创建的最邻近搜索（nearest neighbor search），速度提升了 8.5 倍 Faiss 只支持在 RAM 上搜索 Faiss 用 C++ 实现，支持 Python pip install faiss-cpu pip install faiss-gpu

风华正茂dd

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
Embedding在推荐系统中的应用（DeepFM算法）

一、DeepFM算法DeepFM = FM + DNN：提取低阶(low order)特征 => 因子分解机FM 既可以做1阶特征建模，也可以做2阶特征建模提取高阶(high order)特征 => 神经网络DNN end-to-end，共享特征输入对于特征i，wi是1阶特征的权重， Vi表示该特征与其他特征的交互影响，输入到FM模型中可以获得特征的2阶特征表示，输入到DNN模型得到高阶特征。二、推荐系统应用在推荐系统中，可以通过Embedding向量进行快速召回向量化召回，
复制链接

扫一扫