阿里大数据竞赛(天猫推荐算法)

最新推荐文章于 2015-11-30 19:03:00 发布

待火婲燃成火海

最新推荐文章于 2015-11-30 19:03:00 发布

阅读量5k

点赞数 1

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/itsrins/article/details/23209413

版权

本文记录了作者参加阿里大数据竞赛的过程，探讨了如何处理用户行为数据预测购买行为。作者提出通过用户和品牌双关键字排序，结合操作行为权重和时间衰减函数进行预测，并分享了确定系数和阈值的策略，包括使用数据划分评估F1分数来优化参数。

摘要由CSDN通过智能技术生成

莫名其妙搞了这个比赛(戳这里看比赛内容)

然后被虐得生活不能自理 ...开始还能排到top80

现在都要掉出Top500了

感觉到了瓶颈木有提升空间

就放弃治疗了

就把我的一些思路＆想法记录下来吧

比赛大致内容是给你几个月的封装后的数据(用户对品牌的一些操作行为的记录)推测下一个月用户可能会购买神马

因为字段都是加密过的(其实就是用户和品牌都是用ID表示)

这样就无法考虑用户之间和品牌之间的相互作用

这种情况下我们来考虑用户A是否会购买品牌X的商品只需要考虑之前用户A对品牌X的操作行为就好

这一点应该很容易想到

然后实现这一点的话大部分人的第一反应应该都是把用户和品牌都给Hash掉吧...(好吧我的第一反应是这个...不知道大家是怎么样)

然后我仔细想了想发现Hash其实是不必要的

我们只需要按用户和品牌双关键字排序就好这样逐记录处理即可(你当前处理的操作记录中的用户和品牌和上一条不一样就说明之前的处理完了)

再考虑到方便输出就令用户为第一关键字，品牌为第二关键字

现在就该考虑如何判断用户A是否会购买品牌X的商品了

我的想法是给予每个操作行为类型一个权值k,再乘上一个与时间相关的函数f(t)

当用户A对品牌X的所有操作的 k*f(t) 之和大于某一特定值L时就认为A会买X了

函数f(t)应该是这个操作行为越久远对现在的影响就越小突然就想到了记忆曲线这玩意儿了...然后就用了个e为底的指数函数拟合了

再之后就是考虑系数k和特定值L的确定了

最低0.47元/天解锁文章

待火婲燃成火海

关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。