在搜索排序系统中,冷启动问题表现为当新的商家、商品或新的用户进来时,没有足够的数据用来推测用户对产品的喜好。其中商品冷启动是主要问题,我们通过两方面手段来进行缓解。
解决方法
- 模型上,在模型中引入文本相关性、品类相关性等特征,确保在没有足够展示和反馈的前提下能较为准确地预测。
- 策略上,引入Explore&Exploit机制,对新商家和商品给予适度的曝光机会,以收集反馈数据并改善预测。比如进行流量扶持。常用的 MAB(Multi-armed bandit problem) 算法有 Thompson sampling、 Epsilon-Greedy、UCB。
EE实验
EE的目的就是专门拿出一部分流量,针对新加入的商品给予更多的展示机会,同时整个平台也会收集到用户在这部分商品上的各种行为数据,用在搜索、推荐和广告的排序模型当中。
实验策略:
1.提权到固定展位。
2.用 UCB 的思想去做提权。
退出机制:
参与 EE 的商品怎么退出? 可以采用 PV 机制,即每个商品只要 PV 达到一定数,EE 就结束。选择商品的时候,统计同品类所有的商品购买量达到一定数量时的 PV 值,然后取中位数得到找个PV阈值。