这道题是我面试经常会问到别人的问题,而且我个人认为是一道在日常工作中很容易遇到,尤其是在做推荐或计算广告领域。
题目
我们以电商场景为例,给定一张hive表为用户偏好召回数据表,具体示例如下:
tbl_user_prefer_recall
那么,假设现在我们还没有为个性化场景进行模型排序,所以我们需要以一定的简单策略给用户展示上述的商品列表,但是如果我们直接按照用户的偏好的强弱,直接给用户进行商品展示的时候,会频繁展示某一个分类的商品,例如用户10001,他最强的偏好是衣服,那么,我们给用户在开始展示的时候,连续展示了:P10002,P10004,P10008,P10024,P10035等五个商品。
其实,这不仅会造成用户在一定程度的“浏览疲劳”,而且显示出了我们的展示策略越推越窄的短板,无法丰富用户兴趣偏好的商品展示。
那么,我们如何尽可能地给用户展示的商品能覆盖到他所有或者大部分的偏好分类呢,这其实就是一种叫做“品类隔断”的策略,这个策略的意思就是说,我在给用户展示商品的时候,不能频繁对某一种分类曝光,而要尽可能给用户曝光不一样的分类下的商品,尽可能发掘用户潜在的所有购买行为。