关于2015阿里移动推荐算法大赛的总结(一)
关于2015阿里移动推荐算法大赛的总结(二)——推荐算法
关于2015阿里移动推荐算法大赛的总结(三)——机器学习
写在最前面,第一场比赛的第一轮早已结束,lz组的团队已被淘汰~跟lz组队的人跟lz一样也是新手菜鸟,参加比赛只是兴趣与好奇。现在第二场比赛开始了,lz还会继续玩下去(虽然lz校内科研、项目压力都很大)~
官方给了两个集合表——用户在商品全集上的移动端行为数据表和商品子集表。行为数据里面分别有用户名、商品名、行为类型(浏览、收藏、加购物车、购买)、地理位置、商品类别、行为时间。商品子集里面有商品名、商品类别、地理位置。
题目是根据官方给的一个月的用户行为数据,预测这个月过完的第一天在商品子集中用户可能购买的商品。评分使用的是正确率与召回率的加权。
首先,我们想到的是根据行为的统计特征进行购买的预测,简单的说就是假如用户加入购物车,那么购买的可能性就很大,收藏,浏览产生购买行为的可能性递减。
同时还有地理位置这组信息,从经验判断,地理位置相近购买可能性也越大,在武汉的童鞋一般不会买杭州的电影票或者餐券吧。(这里要说明下,因为是移动端行为数据,很大一部分是类似电影票、门票、代金券、外卖等等