推荐系统
文章平均质量分 81
一杯敬朝阳一杯敬月光
生命不息,代码不止
展开
-
paper阅读 Real-time Personalization using Embeddingsfor Search Ranking at Airbnb
论文阅读原创 2022-12-10 01:16:35 · 242 阅读 · 0 评论 -
DSSM 阅读 - Learning Deep Structured Semantic Models for Web Search using Clickthrough Data
paper 阅读 DSSM原创 2022-10-17 17:12:12 · 334 阅读 · 0 评论 -
paper学习笔记 - PLE
PLE学习原创 2022-08-29 20:16:46 · 798 阅读 · 0 评论 -
Multi-Task Learning Using Uncertainty to Weigh Losses for Scene Geometry and Semantics 阅读
学习笔记原创 2022-06-23 14:56:02 · 1271 阅读 · 0 评论 -
DiSAN: Directional Self-Attention Network forRNN/CNN-Free Language Understanding 笔记
DiSAN阅读笔记原创 2022-06-19 23:08:10 · 589 阅读 · 0 评论 -
MMOE 【Modeling Task Relationships in Multi-task Learning with Multi-gate Mixture-of-Experts】阅读
阅读笔记原创 2022-06-19 00:42:20 · 493 阅读 · 0 评论 -
损失函数MSE、Cross entropy、Hinge Loss-杂记
MSE、交叉熵损失、hinge loss原创 2022-06-10 21:16:04 · 785 阅读 · 0 评论 -
激活函数 Sigmoid、tanh、*LU、softPlus、maxOut、softmax、dice- 杂记
激活函数原创 2022-06-07 00:28:18 · 1186 阅读 · 0 评论 -
Entire Space Multi-Task Model(ESMM)阅读
论文地址:https://arxiv.org/pdf/1804.07931.pdf论文还公开了数据集:数据集-阿里云天池阿里开源的git地址:x-deeplearning/xdl-algorithm-solution/ESMM/script at master · alibaba/x-deeplearning · GitHubABSTRACT介绍了传统的CVR模型的两个缺点:样本选择偏差,训练集的样本是产生点击的样本,但是我们线上用的却是在整个空间的推断,这会影响模型的泛化能力。t.原创 2022-04-26 14:12:16 · 394 阅读 · 0 评论 -
tf
维度相关定义a = tf.Variable([[1,-1,3]], shape=(1,3))<tf.Variable 'Variable:0' shape=(1, 3) dtype=int32, numpy=array([[ 1, -1, 3]], dtype=int32)>a只能是一维矩阵(即向量),shape是(3,)而不是(3,1)也不能是(1,3)...原创 2020-03-14 19:12:35 · 153 阅读 · 0 评论 -
数据探索
变量分析单变量连续型:统计数据的中心分布趋势,变量的分布类别性变量:频次/占比表示类别的分布情况双变量连续型VS连续型 散点图 计算相关性, 类别型VS类别型 双向表 堆叠柱状图 卡方检验 类别 VS连续 小提琴图 ...原创 2021-03-19 00:56:44 · 57 阅读 · 0 评论 -
记录学习遇到的各种问题
目录1. 王喆的https://github.com/wzhe06/SparrowRecSys2.maven搭建spark环境出错3.编译spark出错4.spark Standalone 模式提交出错5.spark yarn 模式提交出错6. nlp pytorch data Field1. 王喆的https://github.com/wzhe06/SparrowRecSys一直报这个错Exception in thread "main" java.lang.Illegal原创 2021-03-07 00:47:12 · 413 阅读 · 0 评论 -
评估指标、稀疏性
1、评估指标TP(Ture Positive): 把正的判断为正的数目FN(False Negative): 把正的错判为负的数目FP(False Positive): 把负的错判为正的数目TN(True Negative): 把负的判为负的数目准确率在所有样本中判断正确的样本占比,[预测正确的样本] / [全样本],(TP + TN)/ all精确率(查准率)针对预测结果而言的,预测为正样本的真实正样本的占比,[正样本 and 预测为正] / [预测为正],P = TP /...原创 2021-02-26 12:10:17 · 1938 阅读 · 0 评论 -
推荐系统
分布式机器学习系统百万日活 - 通常单机 千万日活 - 单机凑活 超过千万 - 单机通常搞不定,需要分布式随机坐标 VS 随机梯度随机梯度用的比较多,也更加稳定,收敛性好。同步异步:在收敛性和速度取折衷...原创 2021-02-25 03:40:25 · 167 阅读 · 0 评论 -
Deep & Cross Network for Ad Click Predictions 阅读笔记
摘要特征工程是很多预测模型成功的关键。这个过程并不容易,需要手动进行特征工程或者遍历搜索。DNN可以自动学习特征交汇。然而他们是隐式的生成特征交互;并不能充分学习到所有的特征交互。在这篇文章中,我们提出了Deep & Cross Network(DCN),DCN保留了DNN的优势,它引入了一种新的交叉网络,可以有效地捕获有限阶(bounded-degrees)上的有效特征交叉。特别地,DCN在每一层进行显示的特征交叉,切不需要手动的特征工程,像对于DNN来说,模型的复杂度也没有提升多...原创 2021-02-05 22:37:26 · 217 阅读 · 0 评论 -
Wide & Deep Learning for Recommender Systems 阅读
摘要非线性特征变换的广义线性模型广泛应用于有稀疏特征输入的大规模回归和分类问题。通过特征交叉得到的memorization of feature interactions具有很好的效率以及可解释性,但是这种做法的泛化需要在特征工程上投入更多的精力。在特征工程下投入更少的精力,通过学习稀疏特征的低维稠密embedding向量,deep网络可以在隐式的特征交叉上取得很好的泛化性能。然而带embedding的deep网络可能过度泛化,特别是当user-item的交互是高维稀疏的时候,可能会推荐不相...原创 2021-02-01 13:02:39 · 319 阅读 · 0 评论 -
day3-搜索和推荐的matching技术
召回系统架构人工规则疲劳度过滤 (干掉一批用户不感兴趣的东西) 依据过去浏览的东西(可以把当前浏览作为实时的属性传到工程系统中消费) 业务要求...原创 2021-01-22 04:32:56 · 204 阅读 · 1 评论 -
day1 - 推荐系统碎碎念
三要素 item: 要推荐的货 user context 算法 机器学习 做推荐,一个基本点,货找人 label = model(item, user, context) -- 3个input label是指什么? --业务上的指标:可以是点击、收藏、加购、评分等 例如:对于点击指标-- label 是预估出当前item被user点击的概率 针对user我们可以设计哪些特征 兴趣,历史点击浏览行为,用户的标签,用户自身的属性 针对item我们可以设计哪些特...原创 2021-01-21 04:01:39 · 139 阅读 · 0 评论 -
Deep Interest Evolution Network for Click-Through Rate Prediction 阅读笔记
摘要点击率(Click-through rate,CTR)预测是广告系统的核心任务之一,其目标是估计用户点击的概率。对于CTR预测模型,需要捕获用户行为数据背后潜在的用户兴趣。此外,考虑到外部环境和内部认知的变化,用户兴趣会随着时间的推移而动态变化。兴趣建模的CTR预测方法有多种,但大多是将行为的表征直接视为兴趣,缺乏对具体行为背后潜在兴趣的专门建模。此外,很少有研究考虑到兴趣的变化趋势。在本文中,我们提出了一个新的模型,称为深兴趣演化网络(DIEN),用于CTR预测。具体地说,我们设计了兴...原创 2021-01-18 13:32:44 · 526 阅读 · 0 评论 -
前深度学习时代-推荐系统的进化之路附部分代码(深度学习推荐系统学习笔记)
传统模型的演化关系图原创 2020-04-21 22:43:45 · 1150 阅读 · 0 评论 -
深度学习推荐系统笔记之前沿实践
1.GBDT+LR14年Facebook发表了广告推荐系统论文Practical Lessons from Predicting Clicks on Ads at Facebook,提出了经典的GBDT+LR模型。系统输入:用户(User)、广告(Ad)、上下文(Context)GBDT构建特征工程和LR预测CTR两步采用相同的优化目标独立训练,GBDT和LR采用不同的更新频率,GBDT部分几天更新一次,LR部分准实时更新。实时数据流架构(online data joiner...原创 2021-01-16 18:54:35 · 173 阅读 · 0 评论 -
冷启动
mark一下:https://www.sohu.com/a/306394287_99979179转载 2020-07-14 08:29:30 · 220 阅读 · 0 评论 -
浪潮之巅-深度学习在推荐系统中的应用(深度学习推荐系统学习笔记)
1 深度学习推荐模型的演化关系图原创 2020-04-24 14:51:41 · 1180 阅读 · 0 评论