大家好,我是为人造的智能操碎了心的智能禅师。
昨天人工智能头条的股东粉群里,有人问到推荐系统的话题。
可能有人还记得一个非常古典的、关于推荐系统的例子:超市把尿布和啤酒摆一起,显著的增加了二者的销量。原因是很多买酒的父亲们看到旁边刚好有尿布,就回想起临行前,孩儿 ta 妈嘱咐买尿布回家的话来,顺手就买了。
Amazon 可能是最典型的受益于推荐系统的零售商;社交网络更是极大的依赖推荐系统。为了把新用户留住,SNS 们又是推荐“值得你关注的人”,又是推荐你“可能感兴趣的话题”,又是推荐你“发什么样的内容更容易被?”等等等等。
最早的推荐算法,只是零售商根据自己的经验,对用户行为的一种简单的预判。而机器学习,可以说为推荐算法这只?,插上了隐形的翅膀,从此变成了一只天马,得道升天。
今天带来的文章,由我们的特约合作伙伴第四范式,来跟大家讲一讲 AutoML 推荐系统中的应用,希望对正在研究这方面的读者,有所帮助和启发。
还是老规矩,欢迎大家吐槽、投稿。如果你还没有在股东粉群里,可以从下图指示找到合作、投稿、进群入口。
以及咱们的公众号接入了机器人,大家闲来无事的时候,可以和机器人聊聊天,谈谈心。而且禅师也可能会冒充机器人回复你,如果你能发现混在机器人回复中禅师的真人回复,会有小礼品送出。
接下来按照惯例流程,要给我们的作者鼓吹介绍一番:
第四范式是一家人工智能技术与服务提供商,致力于降低人工智能应用的门槛,基于机器学习技术研发惠及不同领域的人工智能产品及解决方案,助力企业实现智能变革,提升运营绩效,创造商业价值。目前,已在金融、政府、制造、零售、医疗、文化、教育、互联网等领域有近 2000 个成功落地案例,SaaS 公有云服务客户超过 1000 家,服务金融机构资产总规模超过 50 万亿。
全文大约8500字。特别提醒大家,本文内容特别长,知识点特别多,读完需要特别长时间,记得收藏和分享;读完可能需要十好几首下面这首歌的时间
?
![分割线 640?wx_fmt=png](https://i-blog.csdnimg.cn/blog_migrate/f29cac478b270578d0fb550ad43c1933.png)
前情摘要
今天,推荐系统的模型和应用已经相当成熟,然而部署一套全新的推荐系统,甚至仅在已有系统上添加数据维度和模型优化依然是非常耗时耗力的事情。
这是由于不同数据源的分布不尽相同,要达到满意的建模效果,每个建模的环节,包括数据处理、特征工程、模型的选择和超参数选择等都需要随之变动和优化。
以往这些工作都是建模工程师通过 A/B Test 和 Grid Search 等方式来手动调试有限的几种建模组合方式,并挑出最好的配置作为上线用的系统配置。然而要想从少量的尝试中找到优质的模型方案,不仅要求工程师有丰富的建模经验,可能还需要一点点运气,成本和风险都比较高。
近几年在机器学习领域兴起的自动机器学习(AutoML)技术,便是为了解决机器学习模型训练难,落地难这个痛点所做的努力。我们同样可以把 AutoML 技术应用到推荐系统的建模中,这次分享主要介绍用哪些方法来打造一个 AutoML 系统,并用于提升推荐系统的搭建效率。
如果我们看今天的机器学习应用(以监督学习为主),它大致可以分为两大类:
传统机器学习
用的比较多的模型有 LR、Gradient Boosting Machine、Random Forest、KNN 等,模型本身比较简单和成熟,但是由于这些模型无法拟合非常复杂的非线性函数,我们需要通过特征工程把原问题空间转化到一个机器学习模型容易学的表述空间,才能得到好的效果。
深度学习
相对传统机器学习,近几年兴起的深度学习,由于其强大的模型表达能力,相对弱化了特征工程的重要性,具有端到端学习的能力。