关于2015阿里移动推荐算法大赛的总结(一)
关于2015阿里移动推荐算法大赛的总结(二)——推荐算法
关于2015阿里移动推荐算法大赛的总结(三)——机器学习
后来我们回归到正途上,虽然我们也想用深度学习的方法,但是毕竟还是菜鸟的水平,所以把目标定在能用机器学习跑通一遍,顺带熟悉一下各种机器学习算法的实际应用。但是最后的最后我们只用了LR,然后就受打击了。哈哈~
想用机器学习的方法,那么思路其实也很明确,问题是那一天用户是买还是不买,那么可以看成是二分法。通过用户行为方式来判断是否会购买。就是把用户行为等抽象成特征向量得到训练集,扔进机器学习算法训练出一个模型,然后用测试集预测出结果。虽然机器学习的算法有不少,而且需要不断的调整参数和优化,但是我认为特征向量的选取才是最关键的,很显然我们到最后也没搞好~~~
下面详细整理总结一下~~~
首先,肯定要进行数据预处理,去除噪声数据(如非正常流量,爬虫或者机器行为产生的数据),数据时间刚好是双11刚过,双12在其中,所以也应该考虑到购物节对用户购买行为的影响。
关于特征向量的选取,我用了下面这种主观上可以接受的想法~
数据集是一个月的用户行为,