淘宝从空间预测到个性化推荐

2013-09-07 阿里技术嘉年华

文/徐萧萧


【导读】本文分享了从空间预测到推荐领域的一些前沿思路,这些思路一定程度上可以缓解推荐领域中的一大难题:多样性问题。 


    个性化推荐相信大家都不会陌生,当前已经深入到了我们很多的业务场景,基本上谈到电子商务和网上购物,第一个想到的挖掘场景就是个性化推荐。


    常用的推荐算法大致分为3类:


       1. 关联规则

       2. ITEM-BASED算法

       3. USER-BASED算法


    这3种方法都是比较传统的推荐算法。在应用上来看纯粹的关联规则算法在推荐领域已经用的比较少了,而ITEM-BASE的应用是最为广泛的,亚马逊和阿里的推荐算法绝大部分都是围绕着ITME-BASE展开的,这种方法推荐结果的可解释性最强。例如当你买过一本理论力学的书后,系统给你推荐一本材料力学,你总是可以理解的。


    所谓啤酒和尿布的这种例子在真实的场景中出现的是很少的,甚至会给客户带来一定疑惑。而USER-BASED则在影视推荐中用的比较多,例如豆瓣。买东西和看电影的动机还是有很大不同的,在电影推荐中强调一定的实效性和热门性,通过USER-BASED的算法可以把近期的关注热点有效的推荐出来。所以总结来说ITEM-BASED更适用于电子商务平台,而USER-BASED更适用于基于social的社会化站点 (包括音乐,电影和图书分享,例如豆瓣,Mtime等) 。


    那么空间预测又是什么,简单来说就是预测你在某一时刻可能出现的地点。


    例如需要预测某位技术宅朋友上午10点、中午12点、下午3点、晚上8点分别在什么地方。


    那么接下我们想想这个问题该如何解决:


    1. 如果是一般的工作日,那么问题相对简单,基本上上午10点会在公司上班,中午12点在食堂、下午3点又回到公司,晚上8点可以根据该同学的作息习惯预测他是仍然在公司加班还是已经回到家中。


    2. 如果是双休日,问题稍微复杂了一点,当然也还是有迹可循,如果我们能采集到该同学历史上在双休日的作息行为,仍然可以给出有效的预测。


    3. 今天该同学去北京旅游了,那么他会出现在哪?这个问题就有点头大了,前面两种情况的思路完全不适用,北京对于这位同学来说可能以前只是偶尔去过,或是根本没去过,我们没有办法根据历史数据做出有效的预测,那么该怎么办。好吧,我想我应该去问问其他去北京旅游过的同学,问问他们的行程,或是查阅一下北京的热门景点,来得到一些启发。于是我们可以整理出故宫、长城、鸟巢、水立方等著名景点,接下来可以进一步根据该同学的性格偏好来猜测他可能会去的地方。


     看起来空间预测和个性化推荐没什么必然联系,但最近有一些研究学者已经在用一些空间预测的思路来完善推荐算法,进而产生了一种新的学派——基于意图的推荐。

    

    我们再来分析一下两者之间的潜在联系。曾经有个女生问我,我要买一件衣服,买什么好?我说“你完全可以根据自己的喜好来买,这个问题根本不应该问我..”,然后她又问,我想送男朋友一个手机,送什么好?我知道她平时对手机没什么研究,于是我说“这个更简单,首先你想买什么价位的,然后去看看这个价位中的热卖手机就好了”,是不是感觉和空间预测有点类似了呢?


    我们可以把商品的类目想象成地理位置,服装对于这个女生来说就是她经常去的很熟悉的地方,而手机则是她比较陌生偶尔去‘旅游’的一个地方,当她处于服装这个类目时,系统应该根据她的偏好来做推荐,而当她处于手机这个类目时系统则应该通过分析热销商品来给出推荐结果。当我们把客户的空间位置引入到推荐系统当中,并且根据客户在不同时刻所处位置的不同来调用不同的推荐算法可能会使我们的推荐精度提高很多,同时给传统的推荐引擎打开了另一扇大门——组合推荐系统。


       通过前面的描述其实我们可以发现,在推荐系统中引入空间的概念其实并没有创造新的算法,只是将两种形式的算法进行了一种基于空间概念的组合。既然是组合,那么就不局限于空间概念,我们也可以尝试在同一时间将多种方法组合,给出更加丰富的推荐结果,事实上有不少推荐引擎为了解决推荐多样性的问题已经这么做了。


    我们都知道单一的item-based算法经常会出现的一种情况是:如果我不久前购买了一款手机,那么他就会继续将各种相关联的手机或手机配件推荐给我,造成推荐结果非常单一,如果有6个推荐位,那么很可能这6个推荐位推荐的都是同类型的商品,一旦不能满足客户意图就‘全军覆没’。

        

    一种相对聪明的做法就是‘不把鸡蛋放在同一个篮子里’,我们可以用多种算法的组合来填充这些推荐位,例如前2个位置采用item-based算法给出结果,中间两个采用基于空间的热销推荐给出结果,最后两个位置用user-based或新颖性算法给出其他的商品,这样客户看到的推荐信息不再是单一的,他的意图被覆盖的可能性将会提升很多。


    由空间预测到推荐领域的一些前沿思路就先分享到这里,这些思路一定程度上可以缓解推荐领域中的一大难题:多样性问题。而推荐领域的另外一大难题新颖性问题(小而美商品的推荐)有机会的话下次再给大家分享。       


【嘉年华推荐】


    本文来自搜索算法和个性化推荐系列(回复 搜索与个性化 可查看该系列所有文章)。


    今天还推荐来自 MacTalk 的一本电子书,作者(微信号:Sagacity-Mac)对技术嘉年华表示该书正在朝着一个里程碑目标迈进,书籍名为《人生元编程》,主要是他微信的文章摘录,主要讲Mac Tips、程序员与编程以及嘉年华一众同学最喜欢的工具系列,可读性很高,所以推荐给大家。


    由于本书在多看书城售价高达¥2.99,实在囊中羞涩的同学也别捉急,你可以回复030  滚动到文章末尾,查看技术嘉年华的一个送书活动试试运气,简单来说,就是你回复你想看的书籍名,例如:《人生元编程》就能参与活动了。友情提示:返奖率高达87.53%

    

    点击阅读原文可查看本系列开篇文《004-淘宝搜索算法综述之一:淘宝搜索的特点》。


--

微信名称:阿里技术嘉年华

微信号:alibabatech

简介:传播原创高质量的技术内容

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值