swing:一种工业界广泛使用的召回算法

Swing是阿里巴巴提出的i2i召回算法,它考虑用户间的多样性,广泛应用于抖音、小红书等推荐系统。相比传统Item-CF算法,Swing更注重用户集合的交集大小与用户之间的相似度,从而提高物品关联度的准确性。
摘要由CSDN通过智能技术生成

swing是阿里原创的i2i召回算法(论文具体参考[1]),在阿里内部的多个业务场景被验证是一种非常有效的召回方法。据笔者了解,swing在工业界已得到比较广泛的使用,抖音,小红书,B站等推荐系统均使用了swing i2i。

传统icf算法

在介绍swing之前,我们先简单回顾下传统的item-cf是如何计算物品之间的相似度。

最经典的item-cf算法基于cosine来计算相似度,下面是传统item-cf对于item i和j的相似度定义。Ui表示喜欢物品i的用户集合,Uj表示喜欢物品j的用户集合。分子是Ui和Uj的交集大小,也就是喜欢i又喜欢j的用户数量。分母是Ui和Uj模的平方根,可以避免热门item与多数item都有很高的相似度。(注:由于热门item通常质量表现较好,在工业界实际使用时分母可能不会使用,特别是基于增量方式实现的icf)

 传统item-cf背后的直觉是,如果大量用户同时喜欢两个物品,那么这两个物品之间应该有比较高的关联(相似度)。

swing算法原理

与传统item-cf类似,swing也是用来衡量物品之间的相似度,下面具体介绍swing算法。

swing的直觉来源是,如果大量用户同时喜欢两个物品,且这些用户之间的相关性低,那么这两个物品一定是强关联。

具体地,swing相似度的定义如下。对于这个公式,

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值