推荐系统
文章平均质量分 87
长相忆兮长相忆
一个爱生活爱学习的小学生。
展开
-
【推荐算法】MMoE模型:Modeling Task Relationships in Multi-task Learning with Multi-gate Mixture-of-Experts
MMoE是谷歌在2018年发表在KDD上的一篇基于多任务学习的经典论文,其使用场景是对不相关任务的多任务学习。在推荐系统中,这些不相关的任务可以示例为:视频流推荐中的CTR、时长、点赞、分享、收藏、评论等相关性不强的多个任务。原创 2022-12-22 20:49:34 · 3699 阅读 · 1 评论 -
【推荐算法】DSSM双塔模型:Deep Structured Semantic Models for Web Search using Clickthrough Data
DSSM,全称Deep Structured Semantic Model,就是我们通常所说的双塔模型,是微软公司提出的一种基于深度网络的语义模型,其核心思想是将query和doc映射到到共同维度的语义空间中,通过最大化query和doc语义向量之间的余弦相似度,从而训练得到隐含语义模型,达到检索的目的。DSSM有很广泛的应用,比如:搜索引擎检索,广告相关性,问答系统,机器翻译等。原创 2021-06-17 11:27:45 · 5643 阅读 · 1 评论 -
【推荐算法】DeepFM模型:A Factorization-Machine based Neural Network for CTR Prediction
DeepFM模型是由哈尔滨工业大学和华为实验室联合提出的,将FM模型结构与Wide&Deep模型进行了融合。DeepFM可以同时提取低阶组合特征与高阶组合特征。其中,FM模型负责提取一阶特征以及两两交叉特征;DNN模型负责提取高阶特征。相比于谷歌最新的Wide&Deep模型,DeepFM模型的Deep component和FM component从Embedding层共享数据输入,同时不需要专门的特征工程,在推荐系统中取得了不错的推荐效果。原创 2021-06-03 14:51:03 · 2936 阅读 · 3 评论 -
【推荐算法】FM模型:Factorization Machines
FM算法是一种基于矩阵分解的机器学习算法,是为了解决大规模稀疏数据中的特征组合问题。在传统的线性模型如LR中,每个特征都是独立的,如果需要考虑特征与特征之间的交互作用,可能需要人工对特征进行交叉组合;非线性SVM可以对特征进行kernel映射,但是在特征高度稀疏的情况下,并不能很好地进行学习;现在也有很多分解模型Factorization Model如矩阵分解MF、SVD++等,这些模型可以学习到特征之间的交互隐藏关系,但基本上每个模型都只适用于特定的输入和场景。为此,FM出现了。原创 2021-05-17 11:41:09 · 4689 阅读 · 3 评论 -
【机器学习】推荐系统、机器学习面试题整理
推荐系统、机器学习常见面试题整理。原创 2021-05-10 23:18:50 · 2462 阅读 · 0 评论 -
【推荐系统】推荐系统中一些常用的技术方法
本文主要总结了一些推荐系统中用来解决实际问题常用的技术方法。1、威尔逊区间平滑威尔逊区间平滑可以用来修正item的点击率CTR。Click-Through-Rate,即点击率,是推荐系统中一项重要的衡量指标。原始的CTR计算公式:CTR = 点击数 / 曝光数。这样的计算方式只考虑了相对值,没有考虑绝对值,即没有考虑曝光的数值大小。因为,在曝光很少的情况下,计算出的CTR并不真实可靠,而样本数越大,CTR的比例才越准确,更能反应真实情况。举个例子,有三个广告:A:点击数5...原创 2021-04-29 11:31:44 · 2888 阅读 · 0 评论 -
【推荐系统】短视频推荐系统概述
本博文主要对业界短视频推荐领域做一个系统概览,包括推荐系统与架构、召回算法与策略、排序算法的演进、分发策略的控制四大部分。原创 2020-09-17 20:45:11 · 8273 阅读 · 2 评论 -
【机器学习】word2vec学习笔记(一):word2vec源码解析
本文主要对google的word2vec源码进行了简要的分析,并给出了源码的一些注释。对于word2vec的算法原理并没有进行深入的讨论。原创 2019-04-30 20:36:23 · 1416 阅读 · 0 评论 -
【推荐算法】Graph Embedding系列之EGES: Billion-scale Commodity Embedding for E-commerce Recommend in Alibaba
这篇paper是淘宝团队在2018年发表的一篇论文,在淘宝的推荐中,主要面临着三个技术挑战,分别是可扩展性(scalability)、稀疏性(sparsity)和冷启动问题(cold start)。论文的基本思想是在DeepWalk生成的graph embedding基础上引入补充信息,也就是将边信息引入到GraphEmbedding框架中,借此来解决上述的三个问题。原创 2020-07-13 11:51:20 · 1294 阅读 · 1 评论 -
【推荐算法】Graph Embedding系列之node2vec: Scalable Feature Learning for Networks
Node2vec是一个网络中可扩展特征学习的半监督算法,node2vec采用了一个常规的基于图的目标函数并使用随机梯度下降算法进行优化。node2vec是一种综合考虑DFS邻域和BFS邻域的graph embedding方法。简单来说,node2vec可以看作是deepwalk的一种扩展,可以看作是结合了DFS和BFS随机游走的deepwalk。Node2vec通过调整随机游走权重的方法使graph embedding的结果在网络的同质性和结构性中进行权衡。原创 2020-07-07 14:35:44 · 1935 阅读 · 1 评论 -
【推荐算法】Graph Embedding系列之LINE: Large-scale Information Network Embedding
LINE能够将非常大的信息网络embedding到低维的向量空间,同时LINE适用于带权或者不带权的有向图和无向图。LINE定义了一阶相似度和二阶相似度,并在目标函数保留了网络的局部结构和全局结构。在优化目标函数时,LINE采用了边抽样算法,提高了其有效性和效率。原创 2020-07-06 22:17:30 · 1123 阅读 · 0 评论 -
【推荐算法】Graph Embedding系列之DeepWalk: Online Learning of Social Representation
DeepWalk的输入是一张图或者网络,输出为网络中顶点的向量表示。DeepWalk通过截断随机游走学习出一个网络的社会表示(social representation),在网络标注顶点很少的情况也能得到比较好的效果,并且该方法还具有可扩展的优点,能够适应网络的变化。原创 2020-07-06 22:05:07 · 897 阅读 · 1 评论