poi设置复杂公式_第二期(上):基于用户轨迹聚类的POI推荐

本文介绍了《Management Science》上的一篇文章,该文通过用户轨迹模式进行POI推荐。算法包括计算用户轨迹相似度、使用Markov Clustering Algorithm进行聚类以及基于聚类结果进行基本推荐。实验设计验证了算法的有效性,强调推荐系统不一定需要复杂数学,简单算法也能取得良好效果。
摘要由CSDN通过智能技术生成

e647d7034c90aee0f435624f26bdc6b8.png

大家好,欢迎关注本专栏。在第一期内容里,我们介绍了Benders Decomposition和Transit System Planning,第二期的内容我们以《Management Science》上的一篇文章为切入点,展开两个领域的讨论:1)推荐系统;2)Graph Clustering。这篇文章上个月底刚刚在《Management Science》上发布,题目为《Mobile Targeting Using Customer Trajectory Patterns》:

论文链接​pubsonline.informs.org

众所周知,《Management Science》是运筹管理圈的最顶刊,中一篇的难度和中一篇NS正刊差不多,但是我们今天推荐的这篇文章,核心算法简单到不能再简单,我可以用一两分钟把论文解释清楚。我们今天首先讲解文章,再介绍一些相关的算法。

核心流程用一句话就足以概括:根据用户日常出行的轨迹,进行POI推荐。(POI:Point of Interest,比如Shopping Mall)。算法可以拆分为以下几步:

  1. 对用户两两进行比较,根据Trajectory Pattern计算“相似度”,比如早上出门和晚上回家时间接近,那么相似度就高,每天活动的区域接近,那么相似度就高,每天去逛的店铺类型接近,那么相似度也高。从各种维度计算出相似度,再算一个加权平均。
  2. 根据两两之间的相似度,对用户进行graph-based clustering,也就是进行聚类,聚成很多个组,每个组内的人有着相似的Pattern,聚类方法就是最基本的Markov Clustering Algorithm (MCL) 。
  3. 根据聚类结果进行推荐,推荐方法是最基本的推荐方法:看看跟你处在一个组的人经常去哪儿,如果你没去过这个地方,我就把这个地点推荐给你。

结束。第1步,根本没有什么数学,就是找几个指标自定义一些相似度,再加权以下。第3步,连公式都没有了。第2步,利用了Markov Clustering Algorithm,但这是一个20年前就被提出的经典算法。

那么为什么这篇文章能被《Management Science》收录呢?原因其实也很简单。这里我们先推荐一个回答 @周国睿 。这个回答提到的问题提到了当下推荐系统研究的最大问题:研究者提出越来越复杂的算法,利用“高深莫测”的运筹、统计、机器学习的理论。然而,大家都是在意淫,你搞了半天算法,有本事你真的试一试啊?很遗憾,我们找不到“试验品”,我们可以从开源数据集上下载各种已知的用户偏好,比如Netflix,但是你能在生活中找到这些用户,给他们推荐推荐,检验以下效果吗?多数研究者做不到。

当前(2019年)机器学习中有哪些研究方向特别的坑?​www.zhihu.com

这篇文章做到了,不仅做到了,而且还是按照标准社会科学研究方法进行的,设置了各种组别进行分析:

  • Control group (C):不推荐任何广告
  • Treatment group 1(T1):完全随机地推荐广告
  • Treatment group 2(T2):根据用户所处位置推荐附近商店的广告
  • Treatment group 3(T3):用论文提出的算法推荐广告

作者根据结果,详细比对了各个组别,论证了算法的有效性。我觉得这篇文章很好地说明了关于推荐算法的一个问题:推荐这个东西,有时候真的不需要什么太复杂的数学,有时候简单的就是最好的。但简单的也好,复杂的也罢,空说好不好都没意义,是骡子是马拉出来溜溜,遛完了,你的这篇文章才真的有价值。

这篇文章的实验设计,我也推荐大家读一读,能在《Management Science》上发表的,实验设计都是经受住考验的,有时候纯粹搞数学和计算机的同学,比较缺少这方面的技能。

今天这一期,我们重点探讨了recommendation的部分,跳过了算法中的核心一步:Markov Clustering Algorithm。之所以本期推荐这篇文章,与这一算法也有关系,因为这两周看到很多篇论文,都用到了Markov Clustering Algorithm。可见这个算法虽然简单,但真是好用,我们下一期会推荐相关的几篇论文,并详细介绍两种有代表性的Clustering方法:Markov Clustering Algorithm和Clique Percolation Method。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值