抖音推荐系统冷启动

抖音通过用户移动设备信息、协同过滤和兴趣标签映射解决新用户冷启动问题。具体方法包括:1) 根据用户设备型号和安装APP推荐;2) 利用兴趣标签筛选内容;3) 使用WeakAND算法找到相似用户的内容偏好。同时,建立标签数据库,抓取APP标签以丰富推荐依据。
摘要由CSDN通过智能技术生成

推荐系统的冷启动问题是指对于新用户系统缺乏足够的数据来捕捉用户的兴趣并有效的推荐内容。这个问题是推荐系统再实际产品应用中的一个主要挑战。再众多针对此问题的解决方案中,又一类广泛使用的方法是鼓励用户用社交网络账号登陆推荐系统。推荐系统可以利用用户社交网络的信息(比如关注关系、好友关系、兴趣标签、发布内容等)初始化用户的兴趣模型,从而进行有效的推荐。

  1. 通过挖掘用户发布内容的关键字作为用户兴趣关键字。
  2. 利用用户的社交关系吧用户好友或者关注对象的兴趣标签汇聚到用户身上。

但在实际应用中,很多用户都比较敏感自己的隐私问题或者怕麻烦不会选择社交网络账号登录推荐产品。据统计,再一些热门的新闻推荐类的产品中,所有用户中用微博、QQ、微信等主流账户登录的不超过50%。这就是使得现有的方法很难彻底解决推荐系统新用户的冷启动问题。

下面我们就来讲讲抖音是如何解决这类用户的冷启动问题的:
1. 获取用户移动设备信息,通过该用户的移动设备的操作系统获取用户的移动设备型号及安装再该移动设备上的所有APP信息。
2. 基于协同过滤产生第一推荐列表,将数据库中与该用户的移动设备型号或安装的APP类似的其他用户喜欢的内容作为推荐内容生成第一推荐列表
3. 基于兴趣标签映射产生第二推荐列表,把APP显式地映射到一个或多个兴趣标签,然后根据每个兴趣标签筛选对应的内容作为推荐内容生成第二推荐列表。
4. 将上述的第一推荐列或第二推荐列表中的内容推荐给该用户。

下面我们来看看具体是如何算的:
1. 筛选常用有区分性的APP。
2. 选取常见的只能手机机型。
3. 把APP和机型映射到特定维度。
4. 对于给定用户,从该给定用户的移动设备信息中抽取移动设备特征向量。
5. 基于WeakAND算法找到向量距离和该给定用户最近的K个用户。
6. 统计这K个用户中点击率最高的内容作为推荐内容。

<
推荐系统冷启动算法主要解决在推荐系统中,当用户或物品的历史行为数据非常有限或者完全缺失时,如何进行有效的推荐的问题。下面是推荐系统冷启动算法的综述: 1. 利用已有用户信息进行粗粒度推荐:根据用户的基础属性信息(如性别、设备信息、网络信息、位置等)进行推荐。可以根据专家经验和基础属性信息构建更细粒度的排行榜或热度榜,从而进行推荐。 2. 利用算法和基础属性进行推荐:可以利用决策树模型等算法,根据用户的基础属性信息构建冷启动榜单。通过训练模型,将用户的基础属性作为特征,构建冷启动榜单,从而进行推荐。 3. 利用外部数据寻找相似用户进行推荐:可以利用外部数据,如微信好友、拼多多好友等,找到与目标用户相似的用户,从而进行推荐。通过分析用户之间的社交关系或者共同兴趣等信息,找到相似用户的行为模式,进行推荐。 4. 物品冷启动:当物品的历史行为数据非常有限或者完全缺失时,可以利用物品的基础属性信息进行推荐。根据物品的属性信息,构建冷启动榜单,从而进行推荐。 5. 协同过滤推荐系统:协同过滤是一种常用的推荐算法,它利用用户或物品间的相似度以及历史行为数据对目标用户进行推荐。然而,协同过滤推荐系统面临数据稀疏性和可扩展性等问题,特别是在冷启动情况下。 综上所述,推荐系统冷启动算法主要包括利用已有用户信息进行粗粒度推荐、利用算法和基础属性进行推荐、利用外部数据寻找相似用户进行推荐、物品冷启动以及协同过滤推荐系统等方法。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值