推荐系统
文章平均质量分 74
凝眸伏笔
纵然伤心也不要愁眉不展,因为你不知道谁会爱上你的笑容。
展开
-
分类问题:AUC小于0.5的原因及解决方案
当数据集中某一类的样本数量远超于其他样本的时候,模型自然会有一种倾向使得分类结果偏向于该类样本,这是概率统计中先验的性质。第二种,解决样本分布不均衡,我们可以在分类错误时通过对不同类别的样本施加不同的惩罚,比如对数量少的类别的样本施加较小的惩罚,对数量多的类别的样本施加较大的惩罚。第一种,我们可以通过采样的方式,手动的平衡不同类别的样本的数量,主要的手法有欠采样和重采样。当原始数据的量纲相差过大,而标签中“0”的过多时,训练出的模型系数会倾向于稀疏。在做分类任务时,遇到过auc小于0.5的情况。原创 2022-11-03 20:41:46 · 7708 阅读 · 0 评论 -
ESMM阅读笔记
论文:《Entire Space Multi-Task Model: An Effective Approach for Estimating Post-Click Conversion Rate》阿里,20181.motivation不同于CTR预估问题,CVR预估面临两个关键问题:Sample Selection Bias (SSB)转化是在点击之后才“有可能”发生的动作,传统CVR模型通常以点击数据为训练集,其中点击未转化为负例,点击并转化为正例。但模型预测时,则是对整个空间的样本进行预.原创 2022-02-14 23:30:05 · 467 阅读 · 0 评论 -
多模态召回
要处理自然界、生活中多种模态纠缠、互补着的信息,多模态学习是必由之路。随着互联网交互形态的不断演进,多模态内容如图文、视频等越发丰富;原创 2020-09-28 22:48:41 · 425 阅读 · 0 评论 -
FTRL(follow the regularition leader)的原理及其实现
一.原理二.代码2.1训练模型2.2预测thinking参考:1.拓展性质的详细解说:https://blog.csdn.net/ningyanggege/article/details/811337852.ftrl要优化的RDA和FOBOS:https://www.jianshu.com/p/168ac88346ec3.大厂们的在线学习:https://www.cnblogs.com/EE-NovRain/p/3810737.html4.ft...原创 2020-07-20 23:44:20 · 410 阅读 · 0 评论