推荐系统中保序回归校准方案

校准目标是:使用户行为的预估值尽可能逼近真实概率值,众所周知,在推荐系统中,很多情况下,我们的点击率通常会被错误的估计(通常会被高估),所以需要进行校准。

一、保序回归

保序:只影响CTR的绝对值,但不影响多条数据CTR之间的相对大小,即不影响商品最终的排序结果
分桶:将所有数据按模型输出的预估值(pCTR)进行分桶,对桶内数据的label(0/1值)求平均,作为近似的真实CTR
回归:通过分段线性回归将pCTR映射到CTR上

二、校准评价指标

1、predict click over click(PCOC)

PCOC指标是校准之后的点击率与后验点击率(近似真实概率)的比值,越接近于1,意味着在绝对值上越准确,大于1为高估,小于1为低估,是一种常用的高低估评价指标。

2、calibration-N(cal-N)

cal-N将样本集合按照自定义规则划分出多个簇分别计算PCOC,并计算与1的偏差作为标准误差。举个例子,将pctr根据值大小划分为多个桶,每个桶为一个簇,计算每个簇的PCOC及其与1的偏差 数学公式:
在这里插入图片描述
参考:https://zhuanlan.zhihu.com/p/460061332

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
据了解,数据库中的视图是一个虚拟表格,它是基于存储的表或其他视图的查询结果。视图被用来简化复杂的查询操作并保护数据安全性,只显示用户所需要的数据。在设计师为user表创建一个usel视图时,数据字典中应该保留有关该视图的相关信息。 首先,数据字典是一个描述数据库中数据元素及其关系的元数据集合。在数据字典中,会包括对各个数据库对象的描述,如表、视图、列等。因此,在为user表创建usel视图后,数据字典中应该记录该视图的名称(usel)以及所基于的原表(user)。 其次,数据字典中还应该记录与视图相关的权限信息。视图的权限控制可以限制特定用户或角色对数据的访问权限。因此,数据字典中应该包括usel视图的访问权限信息,如哪些用户或角色有权访问、对视图的读写权限等。 另外,数据字典还可以包含有关视图的统计信息。这些统计信息包括视图的行数、列数、索引信息等,可以帮助数据库优化器选择最佳执行计划,并提高查询性能。 最后,数据字典中还可以记录与视图相关的注释信息。注释可以提供有关视图的额外说明或描述,方便其他开发人员理解和使用。 综上所述,在为user表创建一个usel视图后,数据字典中应该保留有关该视图的名称、基于的原表、权限信息、统计信息以及注释等相关信息,以便设计师和其他用户可以查阅和了解这个视图的详细信息。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值