![](https://img-blog.csdnimg.cn/20201014180756926.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
推荐系统
文章平均质量分 71
赵小丽-programer
mid-core programer
展开
-
我想简单的写写nce和infonce
推荐系统——对比学习对比学习 相关背景对比学习提出的背景对比学习方法正例的构建方法负例的构建对比学习的效果、趋势对比学习在推荐中的应用总结对比学习 相关背景对比学习提出的背景度量学习+无监督学习对比学习方法希望投影空间中两个正例比较接近,如果是负例,则远离。通过infoNce Loss 来达到这个目标正例的构建方法负例的构建对比学习的效果、趋势对比学习在推荐中的应用总结引用:1....原创 2022-05-18 18:11:31 · 4500 阅读 · 0 评论 -
推荐系统中多任务学习方法总结-持续更新
为什么有多目标单目标无法衡量系统的好坏多任务学习样本加权:经验将另外一个目标折算到base 目标上。按照比例对样本加权。(在较少的损失base 目标的基础,提高其他目标)原始损失函数 交叉熵损失 F=-ylog(y_t)-(1-y)log(1-y_t);加权损失函数 F_w = -(1+C)ylog(y_t)-(1-y)log(1-y_t)BP 时,对于权重为C的目标,损失增加*C,导数更新偏向加权目标(加权正样本与不加权正样本之间的差异会影响原始模型在基础label 的学习:有偏.原创 2021-02-28 20:00:25 · 439 阅读 · 0 评论 -
tf从hdfs 直接获取数据训练模型
文章目录背景操作环境tensorflow1.13 ,python2.7获取hdfs 的文件目录input_fnshell 中配置需要额外关注的是:从hdfs 训练,需要在保存数据之前打乱顺序与本地相比,训练运行耗时 增长6%,AUC训练效果不受影响注意背景训练集数据集比较大,目前train 集合已经27G,每次占用的磁盘空间较大getmerge 时间太长,15分钟用来获取训练集、测试集、评...原创 2020-04-26 11:12:40 · 1808 阅读 · 0 评论 -
排序指标NDCG(Normalized distributed cumulative gain)
排序指标NDCG(Normalized distributed cumulative gain)归一化累积折扣信息增益值:用于衡量排序质量逐步介绍 CG->DCG->NDGCCG:衡量推荐结果的相关度在NDCG中,相关度分成从0到r+1的等级(r是可设定的):相关度可以自己定义,原创 2019-01-25 09:14:17 · 1819 阅读 · 0 评论 -
tfserving 之模型调用(python 版本)包含一次数据请求与batch 数据请求
前言最近再做wide and deep 模型线上化,由于在模型中使用了feature_column 函数,担心在线上化时,模型调用时间太吵。参考官网的client 的代码,改写了一下,测试了一下时间。我使用的是feature dict的形式,即将特征组装成字典,调用tfservingdef _float_feature(value): return tf.train.Featu...原创 2019-09-13 20:56:53 · 2333 阅读 · 6 评论