算法
文章平均质量分 60
tf.Print(**)
这个作者很懒,什么都没留下…
展开
-
DeepCTR & DeepMatch简单实用指南
使用指南原创 2022-10-29 23:54:33 · 2053 阅读 · 1 评论 -
多任务学习原理与优化
多任务学习原理与优化原创 2022-08-28 23:59:22 · 2144 阅读 · 0 评论 -
EGES召回原理与优化
EGES召回原理和优化原创 2022-08-14 23:57:36 · 772 阅读 · 0 评论 -
双塔召回 工业实践文章收集
双塔(DSSM)召回,是个性化推荐中常见的一种方式。但是各家的有各种实践方式去优化。 现收集如下五八同城:向量化召回上的深度学习实践https://www.6aiq.com/article/1618011600160五个星,重点看QQ浏览器:小说召回中的DSSM模型优化实践https://www.sohu.com/a/447529493_187948推荐粗排(召回)工程实践之双塔DNN模型https://mp.weixin.qq.com/s/w-J_hz1Qf3Y-Kc8ywx9kUg小米收原创 2022-02-08 16:43:22 · 777 阅读 · 0 评论 -
Tensorflow数据读取
https://tensorflow.google.cn/api_docs/python/tf/data/TextLineDataset?hl=zh-CNtf.data.TextLineDataset 接口提供了一种方法从数据文件中读取。我们提供只需要提供文件名(1个或者多个)。这个接口会自动构造一个dataset,类中保存的元素:文中一行,就是一个元素,是string类型的tensor。https://zhuanlan.zhihu.com/p/163656225https://www.cnblogs原创 2021-06-19 17:47:10 · 199 阅读 · 0 评论 -
Tensorflow Estimator学习
https://tensorflow.google.cn/api_docs/python/tf/data/TextLineDataset?hl=zh-CNtf.data.TextLineDataset 接口提供了一种方法从数据文件中读取。我们提供只需要提供文件名(1个或者多个)。这个接口会自动构造一个dataset,类中保存的元素:文中一行,就是一个元素,是string类型的tensor。https://zhuanlan.zhihu.com/p/163656225https://www.cnblogs原创 2021-06-19 11:43:13 · 301 阅读 · 0 评论 -
推荐系统多目标学习之loss权重
前言多目标学习是推荐算法中很常见的关键点, 通常信息流推荐算法的有ctr, 互动率, 时长等目标。假如只单独优化其中一个肯定无法留存用户或者创收, 譬如只看点击率ctr的话很容易出现一些标题党, 只看互动率的话很多转发保平安的帖子会排序分很高。 因此如何在一个共识或者一套模型中实现多种目标的提升是很多算法组的期望。多目标学习分类与演近对于多目标学习的各类方法,很多文章进行了很好的总结。 譬如下面两个链接。https://lumingdong.cn/multi-task-learning-in-rec原创 2021-06-16 22:23:56 · 2664 阅读 · 2 评论 -
CatBoost整理
Catboost是一种gbdt算法优点一:高效合理地处理类别型特征优点二:解决了梯度偏差(GradientBias)以及预测偏移(Prediction shift)的问题,从而减少过拟合的发生与XGBoost、LightGBM相比,CatBoost的创新点有:嵌入了自动将类别型特征处理为数值型特征的创新算法。首先对categoricalfeatures做一些统计,计算某个类别特征(category)出现的频率,之后加上超参数,生成新的数值型特征(numericalfeatures)。Catb原创 2021-05-12 17:53:58 · 149 阅读 · 0 评论 -
spark整理
Spark基本概念spark就是把分布式计算搬到内存上Spark是个通用的集群计算框架,通过将大量数据集计算任务分配到多台计算机上,提供高效内存计算。配置好后用,pyspark或者IPython notebook写RDDRDD 是Spark中最重要的一环 ,其实就是个格式转换数据集合使得可以在内存上进行mapreduce, 可以从HDFS读,也可以从文件读取这些步骤大体如下:定义一个或多个RDD,可以通过获取存储在磁盘上的数据(HDFS,Cassandra,HBase,Local Disk),原创 2021-05-12 17:46:09 · 77 阅读 · 0 评论 -
推荐算法评价指标 AUC
整理几篇好的对AUC的理解1, https://www.infoq.cn/article/vc71ssa0ug439bxm2knoAUC 更关注前后排序,更适合推荐精排例如0.7的AUC,其含义可以大概理解为:给定一个正样本和一个负样本,在70%的情况下,模型对正样本的打分高于对负样本的打分。可以看出在这个解释下,我们关心的只有正负样本之间的分数高低,而具体的分值则无关紧要。2, https://zhuanlan.zhihu.com/p/73335362这个带图解释更清楚...原创 2021-04-22 15:39:41 · 269 阅读 · 0 评论 -
MMOE 多任务学习推荐算法 和两种实现
本文收录在推荐系统专栏,专栏系统化的整理推荐系统相关的算法和框架,并记录了相关实践经验,所有代码都已整理至推荐算法实战集合(hub-recsys)。 1.背景 何谓多任务,即在一个模型中考虑多个目标。在推荐系统中,往往需要同时优化多个业务目标,承担起更多的业务收益。如电商场景:希望能够同时优化点击率和转换率,使得平台具备更加的目标;信息流场景,希望提高用户点击率的基础上提高用户关注,点赞,评论等行为,...原创 2021-04-17 17:20:23 · 233 阅读 · 0 评论 -
《剑指offer》读书笔记
第一章电话面试要尽可能形象化的语言把细节说清楚千万不要不懂装懂,这是面试大忌,大胆多提问 直到弄清楚面试官意图视频面试:良好的代码命名和缩进对齐习惯,能够进行单元测试,测试在前开发在后碰到有问题了,就设置断电,单步追踪,查看内存,分析调用栈现场面试:准备好向面试官提问的 问题面试分为 行为面试 技术面试和应聘者提问行为面试:自我介绍,项目经验。用star模型描述自己经历的项目Sit...原创 2019-04-18 22:43:55 · 197 阅读 · 0 评论