冷启动一直是各个公司的命门,上周调研了各相似业务公司的补全或者好的trick,总结如下,欢迎各位好友补充评论,可以深入交流有关推荐系统的各个方面。
新用户的行为很有限,尽量通过有限的信息,来猜测用户的兴趣+热门推荐
补全,一方面是为了解决冷启动问题,另一方面是为了补全或提高召回集的多样性。另外,还应该根据运营,产品的角度确定一些人为的规则,比如“近期的一些大型活动”,“主推商品”可以补全这些商品中的一些。
下面列出其他公司在这方面的策略,可以发散借鉴到推荐产品线上。
阿里(2018云栖大会)
对于冷启动问题有三个方面的策略:
1. 基于弱个性化的冷启动
新用户推给他热门商品,快速得到用户更多的行为,进而得到他的兴趣点。
新商品,推给行为多的用户,更快速的得到这个商品的特征。
2. 强个性化的冷启动
冷启动用户虽然特征很少,但可以根据已有的特征,找到和冷启动用户相似的用户喜欢的商品,召回。
3. 在1,2基础上的修正
假设冷启动用户这一类人的行为不信任,将这一类人的所有行为累加在一起,作为这一类人推荐的预测,推给这一类人。比如有一个新注册的老人,就点了一个动漫手办,不可能给他一直推动漫产品。那么这一类人都会点较少的东西,把他们视作一类人,然后产生一个统一的召回集,推给他们,然后获取他们最新的行为信息,等到行为积累到一定程度,就会从冷启动召回中跳出。
美团(2017)
前提:旅游推荐和位置强相关,针对位置深入挖掘
细化城市热销,比如商圈的热销,常住用户当地的热销,异地用户当地的热销,基于用户历史行为推出一些低价商品、新品(增加曝光机会)
引入了Explore&Exploit机制,对新商家和团单给予适度的曝光机会,以收集反馈数据并改善预测。
Twitter新闻推荐
把URL作为新闻的一个unit,给用户推荐一些URL,认为用户可能会对这些URL感兴趣。
我们目前已做,利用关联规则,将URL和最终访问的商品做关联。
今日头条
前提:内容强相关,针对内容深入挖掘
先给内容打标签,受众打标签,接着内容投递冷启动,内容关键词标签背后封装的则是相应的观众群。通过算法将内容标签跟观众标签相匹配,同时由观众互动量级决定进行下一步向多少人分发。
借鉴:设计一个关键词词库,给商品打标签,比如新潮,冷淡系,高性价比等,再给用户打上标签(注册时选择+后期算法生成),利用标签给用户推荐,可以解决召回的精确性和多样性。
其他
冷启动用户,有一些必填项,根据已有的特征,能得到性别,登录地址等最基本信息,进而可以得到类似于购买力的深层特征。然后维护一个rec look up table,基于每类用户的先验信息提供一些产品作为召回。可以按照收入,点击率。
使用一些策略,在用户刚来的时候推给他一些商品,这些商品是极具代表性的,点击,则给用户初始的偏好,然后再用户进一步发生行为后丰富推荐内容。