关于推荐系统中的冷启动问题探讨(Approaching the Cold Start Problem in Recommender Systems)

本文翻译自: https://medium.com/@InDataLabs/approaching-the-cold-start-problem-in-recommender-systems-e225e0084970#.nic6ab24z

  在之前的一篇文章中我们已经讨论过了机器学习在推荐系统中的应用,现在我们把注意力转移到移动应用、电子商务平台、搜索引擎和其他必须面对推荐系统冷启动的问题上。

借助机器学习来发挥推荐系统作用的人数在持续增长。多亏整合了机器学习,推荐系统似乎对用户的习惯和喜好了如指掌,还能与时尚趋势与时俱进,这带来的便利性是毋庸置疑的。

机器学习对推荐技术的成功至关重要  

  机器学习仅仅被用在了最好的推荐系统中,在这样的系统中,预测模型会不断学习并使自己适应于平台的用户和上面销售的商品,对于每一位特定用户,这项技术可以提供自动最优化和个性化的内容。

一个直接从企业以及网站、应用、邮件链接的客户那学习的推荐引擎,产生了“定制算法”以使其变得更聪明,这可是密切关系到每一位客户的问题。

  然而,当用户第一次接触这样的平台,或者需要做一个新的查询,冷启动问题就会出现,而想要成功地提供最好和个性化服务得很大程度上依赖于该平台快速适应新用户和新查询的能力。

产品冷启动VS顾客冷启动

  “冷启动”这个术语来源于汽车,当引擎没有预热,汽车就还不能顺利工作,但是一旦达到了理想温度,汽车就能顺利工作了。而对于一个推荐引擎这不过意味着它还没有达到顺畅工作和产生最佳结果的理想条件。

现在主要有两种应对冷启动的策略(用户冷启动和项目冷启动)和几个帮助推荐系统应对这些问题的方法。

  冷启动问题与某些服务的新用户和新产品相关,这些新产品尚未在某一用户组中获得评论或成功购买的历史记录。而且在没有足够关于特定商品的用户行为时,引擎将不知道怎样去推荐展示它们。基于内容过滤法正成功地解决这个挑战。当产生推荐时,这个系统最先用新商品的元数据,尽管用户行为仍在上一个地方持续一定时间。

  区分那些纯浏览用户与有购物目的的用户也是可能做到的。例如,如果有人在很短的一个时间内点击了从汽车到花盆的任何东西,推荐引擎将会知道不要利用这些用户点击历史记录为其他用户做更深度的推荐。

顾客冷启动情况下,大多数系统使用基于流行度的策略。大多数流行产品基于全球、区域和当地趋势或者一天中的特定时间段被识别出来。加强版引擎使用了以下信息:地理定位、引用(知道访客从哪里来)、设备(手机或电脑,ISO或安卓)、浏览器。所有的这些帮助展现的广告个性化并及时做出推荐。用户首次访问期间仅仅做出2、3次点击之后,这些行为信息就开始生效了,以帮助揭示用户的真正的兴趣爱好。

  当为几乎不了解的人挑选礼物时候大多数人会感到绝望,我们可以明白推荐系统面对不了解任何喜好和需求的全新用户时难作出判断是同样的道理。以当前科技发展的速度判断,这些让机器而不是人做出选择的问题将会变得简单得多。

查看原文请点击indatalabs.com

 

近乎任何机器学习问题的解决方法有几个基本的步骤。 首先,了解问题。这包括明确问题的定义、目标和约束。要知道要解决什么问题,以及问题的局限性和可行性是什么。 其次,数据的准备和理解是非常重要的。需要收集和整理相关数据,并对数据进行探索性分析,以了解数据的特征、分布和关联性。其,数据清洗是非常关键的步骤,包括处理缺失值、异常值和重复值等。同时,了解数据的背景和特点也是必要的,这有助于选择合适的特征工程方法。 第三步是选择适当的模型和算法。根据问题的性质和数据的特点,选择合适的机器学习模型和算法。常见的机器学习算法包括线性回归、逻辑回归、决策树、随机森林、支持向量机、神经网络等。在选择模型和算法时,需要考虑模型的复杂度、泛化能力和计算效率等因素。 接下来是模型的训练和评估。使用数据集将选择的模型进行训练,调整模型的参数和超参数,并使用评估指标对模型进行评估。常见的评估指标包括准确率、精确率、召回率、F1值等。 最后,是模型的调优和部署。根据评估结果,对模型进行调优,包括调整模型结构、正则化、特征选择等。在调优过程可以使用交叉验证等方法对模型进行验证。最后,将训练好的模型部署到实际应用,并进行后续的监测和维护。 以上是近乎任何机器学习问题的一般解决方法。然而,每个问题都有其独特的特点和挑战,需要根据具体情况进行调整和扩展。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值