CEM搜参策略简述

winner8881

已于 2023-06-14 11:24:26 修改

阅读量832

点赞数

文章标签： python 算法 linux cem cem搜参

于 2023-06-14 11:23:13 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_22866291/article/details/131203926

版权

1、要解决的问题

模型有3个输出分数分别是 $score_1$ , $score_2$ , $score_3$ ,需要加权融合成最终的一个输出 $score$
$score = w_1*score_1+w_2*score_2 + w_3*score_3$

2、如何求出合适的 $w$ 参数呢？

假设现有知识为

task1 -> $socre_1$ -> $label_1$
task2 -> $socre_2$ -> $label_2$
task3 -> $socre_3$ -> $label_3$

先定义融合后的 $score$ 为： $score = w_1*score_1+w_2*score_2 + w_3*score_3$ ，分别计算 3 task 的 label 基于融合 score 的 auc 表现：

$auc_1=cal\_auc(label_1, score)$
$auc_2=cal\_auc(label_2, score)$
$auc_3=cal\_auc(label_3, score)$

进而计算整体的 auc，怎么算呢？将上面 3 task 的 auc 进行简单算术平均，也就是：

$mean\_auc =\frac{ (iauc_1 + auc_2 + auc_3)}{3}$

3、总结

通过对 $w$ 参数的搜索，可以得到每次 $w$ 参数下 $mean_auc$ 的表现，从而搜索出 $n$ 个 $t a s k$ 对应 $score$ 的最优权重。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

winner8881 CSDN认证博客专家 CSDN认证企业博客

码龄10年

159: 原创

5万+: 周排名

3万+: 总排名

12万+: 访问

: 等级

2024: 积分

93: 粉丝

81: 获赞

54: 评论

336: 收藏

私信

关注

热门文章

分类专栏

召回 1篇
工具 6篇
推荐系统 14篇
Java 1篇
微服务 1篇
运维 25篇
大数据 16篇
sql 7篇
机器学习 31篇
数据挖掘 21篇
硬件电路 4篇
数据结构 20篇

最新评论

softmax之温度系数
pit_man: 温度系数越小，保留的除正确类别以外的信息越来越少，对负样本的惩罚力度越大，越容易找出正确类别。
声源级、接收电压灵敏度(接收带内响应)
weixin_45952490: 做换能器的大神吗，都是
强化学习 Q-learning 算法举例
winner8881: 注意，1号和4号都可以走出房间，是把外面的所有部分都当成了房间5，所以4不仅可以转移到0,3，也可以转移到5
一文搞懂 AB Testing 的分层分流
winner8881: 如何保证精排不受到重排的影响？这是一个挖坑的问题，因为精排和重排是流量分层且正交的，当然不会收到影响，一般来说，分层从上到下依次是：召回层、精排层、重排层。
DeepFM梳理
winner8881: FM 用隐向量的方式不需要特征共线都可以训练，提高了泛化能力，可以让没有同时出现的特征学好。

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。