推荐系统
Catherine_In_Data
这个作者很懒,什么都没留下…
展开
-
推荐系统中评估指标
1. Recall : 召回率(recall)=TP/(TP+FN) 【预测为真正/实际为正】通俗解释:正样本中有多少是被找了出来2. HR@K (hit_rate) : 命中率分母: 模型预测给出的topk推荐列表个数。分子: 模型预测的topk中有多少是实际点击的。通俗理解:模型给出topk结果,有多少是命中实际点击的。注意: 召回率与命中率是不一样的。...原创 2022-02-08 16:48:01 · 1465 阅读 · 0 评论 -
搜索推荐业务场景下的特征系统搭建
转载:https://zhuanlan.zhihu.com/p/79874983?utm_source=wechat_session前提:前阵子受朋友的邀约,结合自己在推荐搜索系统下的经验,对企业级别特征工程应该如何进行设计,进行了一次分享,下面将这次分享的内容记录下来,以便有需要的朋友进行查看一、融合众多推荐系统、搜索系统下的,特征系统的总结1:一个好的特征搜索推荐业务特征体系一定要全面来进行...转载 2020-03-17 17:57:49 · 748 阅读 · 0 评论 -
1.腾讯: 实时数据流推荐实践
TecentRec :Real-time Stream Recommendation in practice解决问题主要解决问题: 数据量大、实时、准确性实时计算平台选取(1) 支持实时数据统计计算(2)集群扩展性好(3)失败恢复快(4) 活跃度较高的开源工具(5)简单编程模式,支持多种国语言数据存取(data access)如何存取大量不同应用且不同格式的数据。开...原创 2019-12-02 21:19:51 · 373 阅读 · 0 评论 -
推荐类相关文章整理
【推荐类文章整理】UC 信息流推荐模型在多目标和模型优化方面的进展https://mp.weixin.qq.com/s/FXlxT6qSridawZDIdGD1mw提问问题:请教下,UC多目标任务推荐中,关于观看时长加权,我理解有两种: 第一种: 加权=根据该视频观看总时长/平均被观看总是时长。第二种:基于Deep Walk+CBOW对Item进行embedding, 然后基于Gr...原创 2019-10-21 20:40:21 · 251 阅读 · 0 评论 -
信息流短视频时长多目标优化
转载连接:https://yq.aliyun.com/articles/627734/ ,仅做学习参考, 如侵犯权益,请原作者联系删除,其他人转载请备注原作者连接。背景 信息流短视频排序目前使用的是基于CTR预估Wide&Deep排序模型。在此基础上继续一系列优化,通过引入相关性信号、体感信号、多场景的样本融合、高层排序模型取得了不错收益。&...转载 2019-10-21 20:28:16 · 3893 阅读 · 1 评论 -
以 YouTube 论文学习如何在推荐场景应用强化学习
在这篇文章中:推荐系统目前的问题RL应用在推荐的挑战旅程开始RL的基本知识RL在推荐场景的Label特点老生常谈Biasoff-policy vs on-policyimportance weightRL在推荐场景的Objective特点optimization 和 evaluation怎么训练 β 和 πOne more thing:TopK在解决什么问题?listwise 的问题user ch...转载 2019-10-08 14:06:01 · 449 阅读 · 0 评论 -
学习排序 Learning to Rank:从 pointwise 和 pairwise 到 listwise,经典模型与优缺点
学习排序 Learning to Rank:从 pointwise 和 pairwise 到 listwise,经典模型与优缺点 ...转载 2019-09-10 21:23:27 · 4213 阅读 · 0 评论 -
Learning To Rank之LambdaMART的前世今生
感谢作者整理原创链接:https://blog.csdn.net/huagong_adu/article/details/40710305 1. 前言 &...转载 2019-06-19 21:08:06 · 252 阅读 · 0 评论 -
深入解读Airbnb推荐算法
转发:https://blog.csdn.net/Zhangbei_/article/details/87821401,谢谢源作者整理分析那个 去年Airbnb——爱彼迎公布了他们的房源推荐算法,并且成为2018年kdd的最佳论文,论文标题 Real-time Persona...转载 2019-04-29 12:00:51 · 691 阅读 · 0 评论 -
wide&deep 算法
Wide&Deep论文学习笔记概要线性模型学习能力好,深度学习模型泛化能力好。google应用在手机app商店,结果提高了应用商店使用率。TensorFlow源码公开。召回: 简单的match算法+人工规则。减少候选集后,利用wide&Deep算法进行rerank. 包括特征:用户特征, 文本特征, 偏好特征。wide&deep模型结构图Google P...原创 2019-03-28 17:30:15 · 2367 阅读 · 0 评论 -
Learning to Rank算法介绍:GBRank
原文:http://www.cnblogs.com/bentuwuying/p/6684585.html之前的博客:http://www.cnblogs.com/bentuwuying/p/6681943.html中简单介绍了Learning to Rank的基本原理,也讲到了Learning to Rank的几类常用的方法:pointwise,pairwise,listwise。前面已经介绍了pa转载 2017-07-05 20:10:24 · 1036 阅读 · 0 评论 -
推荐算法--基于物品协同过滤算法实现(python: Item-CF)
1. 背景本次测试基于MovieLens数据集实现的基于物品的协同过滤,目前只是在小样本上实现,主要问题是计算太耗内存,后期代码继续优化与完善。 数据集说明:movies.dat中数据是用户对电影的评分。数据格式:UserID::MovieID::Rating::Timestamp。2. 代码import pandas as pdimport numpy as npimport math原创 2017-05-20 19:37:19 · 4162 阅读 · 0 评论 -
Learning to Rank简介
原文:http://www.cnblogs.com/bentuwuying/p/6681943.htmlLearning to Rank是采用机器学习算法,通过训练模型来解决排序问题,在Information Retrieval,Natural Language Processing,Data Mining等领域有着很多应用。 1. 排序问题如图 Fig.1 所示,在信息检索中,给定一个que转载 2017-07-05 20:12:16 · 668 阅读 · 0 评论 -
Learning to Rank算法介绍:RankSVM 和 IR SVM
原文:http://www.cnblogs.com/bentuwuying/p/6683832.html之前的博客:http://www.cnblogs.com/bentuwuying/p/6681943.html中简单介绍了Learning to Rank的基本原理,也讲到了Learning to Rank的几类常用的方法:pointwise,pairwise,listwise。这篇博客就很多公司转载 2017-07-05 20:11:31 · 2317 阅读 · 0 评论 -
推荐算法:协同过滤原理介绍
csdn不支持公式编辑,里面涉及很多公式,只能截(bei)图(cui)。主要学是学习《推荐系统》为了加深记忆就手写了一边,同时也方便后期查看。1. 协同过滤算法简介1) 协同过滤根据相似(或者近邻)偏好推荐物品,分为基于用户的近邻推荐和基于物品的近邻推荐, 其实最终都是推荐物品,只是考虑的角度不一样(类似一种投票方式)。 2) 基于用户的最近邻推荐:根据与用户自身偏好比较相似的用户喜欢的物品,原创 2017-05-06 22:10:31 · 1195 阅读 · 0 评论 -
kaggle案例:广告点击率预估+LR
一、业务背景传统广告与在线广告区别? 传统广告: 类似电视广告,报纸媒体、杂志、广播、户外媒体等。 在线广告: 类似百度搜索广告,facebook页面展示广告。 区别:在线广告更多与用户相关,例,在google上搜索“kids shoes”,则会出现与搜索相关的一些带有广告标签(“Ad”)的连接。例如,淘宝中带有hot标签的物品。 注: 国家规定如果是广告的话,必须带有广原创 2017-05-18 16:46:46 · 11426 阅读 · 11 评论 -
Bandit算法与推荐系统
推荐系统里面有两个经典问题:EE和冷启动。前者涉及到平衡准确和多样,后者涉及到产品算法运营等一系列。Bandit算法是一种简单的在线学习算法,常常用于尝试解决这两个问题,本文为你介绍基础的Bandit算法及一系列升级版,以及对推荐系统这两个经典问题的思考。什么是Bandit算法为选择而生我们会遇到很多选择的场景。上哪个大学,学什么专业,去哪家公司,中午吃什么等等。这些事情,都让选择困难症的我们头很大转载 2017-07-04 18:14:25 · 687 阅读 · 0 评论 -
CTR预估中GBDT与LR融合方案
1、背景CTR预估,广告点击率(Click-Through Rate Prediction)是互联网计算广告中的关键环节,预估准确性直接影响公司广告收入。CTR预估中用的最多的模型是LR(Logistic Regression)[1],LR是广义线性模型,与传统线性模型相比,LR使用了Logit变换将函数值映射到0~1区间 [2],映射后的函数值就是CTR的预估值。LR,逻辑回归模型,这种线性模型转载 2017-07-04 18:19:21 · 356 阅读 · 0 评论 -
在线学习算法FTRL详解
原文链接:http://www.cnblogs.com/EE-NovRain/p/3810737.html 现在做在线学习和CTR常常会用到逻辑回归( Logistic Regression),而传统的批量(batch)算法无法有效地处理超大规模的数据集和在线数据流,google先后三年时间(2010年-2013年)从理论研究到实际工程化实现的FTRL(Follow-the-regulariz转载 2017-07-04 18:23:27 · 1881 阅读 · 0 评论 -
解读阿里精准推广的核心算法
原文:http://www.sohu.com/a/146522397_463994阿里妈妈,是一个想让天下没有难做的营销的大数据平台,它拥有阿里巴巴集团的核心商业数据。在这里,每天有超过50亿的推广流量完成超过3亿件商品的推广展现,覆盖高达98%的网民,实现数字媒体(PC端+无线端+互联网电视端)的一站式触达。在这些鲜亮的数据背后,是什么样的核心算法在起作用?它如何保证商家的产品得到最有效的推荐?转载 2017-07-04 18:25:50 · 796 阅读 · 0 评论 -
推荐系统学习-libFM
介绍 分解机(FM)是一个通过特征工程模拟大多数分解模型的通用方法。libFM是一个实现以随机梯度下降stochastic gradient descent (SGD)和可选择最小二乘alternating least squares (ALS) optimization以及使用蒙特卡洛的贝叶斯推理Bayesian inference using Markov Chain Monte Carlo转载 2017-07-04 18:27:33 · 1037 阅读 · 0 评论 -
推荐系统学习-LibMF
介绍 LibMF的作者是大名鼎鼎的台湾国立大学,他们在机器学习领域享有盛名,近年连续多届KDD Cup竞赛上均获得优异成绩,并曾连续多年获得冠军。业界常用的LibSVM, Liblinear等都是他们开发的,开源代码的效率和质量都非常高。 LibMF是在潜在空间使用两个矩阵,接近一个不完全矩阵。(原句是:LIBMF is an open source tool for approximati转载 2017-07-04 18:28:40 · 428 阅读 · 0 评论 -
推荐系统学习-SVDFeature
介绍 SVDFeature是由Apex Data & Knowledge Management Lab在KDD CUP11竞赛中开发出来的工具包。它的目的是有效地解决基于特征的矩阵分解。新的模型可以只通过定义新的特征来实现。这种基于特征的设置允许我们把很多信息包含在模型中,使得模型更加与时俱进。使用此工具包,可以很容易的把其他信息整合进模型,比如时间动态,领域关系和分层信息。除了评分预测,还可以转载 2017-07-04 18:29:40 · 1169 阅读 · 0 评论 -
推荐算法之工具包
原文:http://blog.csdn.net/dengxing1234/article/details/728972351、SVDFeature 主页:http://svdfeature.apexlab.org/wiki/Main_Page 开发语言:C++ 2、LibMF 主页:http://www.csie.ntu.edu.tw/~cjlin/libmf/ 开发语言:C+转载 2017-07-04 18:31:42 · 733 阅读 · 0 评论 -
基于机器学习方法的POI品类推荐算法
来源:http://tech.meituan.com/category-recommend-base-ml.html前言在美团商家数据中心(MDC),有超过100w的已校准审核的POI数据(我们一般将商家标示为POI,POI基础信息包括:门店名称、品类、电话、地址、坐标等)。如何使用这些已校准的POI数据,挖掘出有价值的信息,本文进行了一些尝试:利用机器学习方法,自动标注缺失品类的POI数据。例如,转载 2017-07-04 18:32:30 · 1436 阅读 · 0 评论 -
美团推荐算法实践
来源:http://tech.meituan.com/mt-recommend-practice.html前言推荐系统并不是新鲜的事物,在很久之前就存在,但是推荐系统真正进入人们的视野,并且作为一个重要的模块存在于各个互联网公司,还是近几年的事情。随着互联网的深入发展,越来越多的信息在互联网上传播,产生了严重的信息过载。如果不采用一定的手段,用户很难从如此多的信息流中找到对自己有价值的信息。解转载 2017-07-04 18:33:15 · 479 阅读 · 0 评论 -
搜狐基于Spark的新闻和广告推荐实战
原文:http://www.csdn.NET/article/1970-01-01/2825353摘要:对一个媒体网站来讲,一个比较重要的任务就是获取用户对于不同类型文章的兴趣分布。用户的兴趣分布会被作为用户属性标签,和其他类型的标签(例如人口属性等)一起用作推荐的模型特征。李滔,中国科技大学博士毕业,现供职于搜狐大数据中心用户推荐部,从事推荐和广告算法研发工作。主要关注技术方向包括广告技术、并转载 2017-07-04 18:34:07 · 766 阅读 · 0 评论 -
广告点击率预估中的特征选择
原文:http://blog.csdn.net/dengxing1234/article/details/73499123互联网广告综述之点击率特征工程一.互联网广告特征工程博文《互联网广告综述之点击率系统》论述了互联网广告的点击率系统,可以看到,其中的logistic regression模型是比较简单而且实用的,其训练方法虽然有多种,但目标是一致的,训练结果对效果的影响是比较大,但是训练方法本转载 2017-07-04 18:21:14 · 429 阅读 · 0 评论 -
Learning to Rank算法介绍:RankNet,LambdaRank,LambdaMart
原文:http://www.cnblogs.com/bentuwuying/p/6690836.html之前的博客:http://www.cnblogs.com/bentuwuying/p/6681943.html中简单介绍了Learning to Rank的基本原理,也讲到了Learning to Rank的几类常用的方法:pointwise,pairwise,listwise。前面已经介绍了pa转载 2017-07-05 20:09:01 · 5680 阅读 · 0 评论 -
微信斑马系统
文章转载地址:http://www.infoq.com/cn/articles/wechat-banma-dmp?utm_source=infoq&utm_medium=popular_widget&utm_campaign=popular_content_list&utm_content=homepage 斑马系统概述: 推出的微信斑马系统,该系统旨在为中小企业和传统行业提供基于微信大数据分析转载 2017-01-05 10:36:29 · 875 阅读 · 0 评论