//2015年4月30日
//未完成
预处理:
刷点击用户
重复记录
一、模型跑不出分层,我们自己来分层
模型一:预测重复购买的 18/12548
模型二:对已买过的商品 43/43720
模型三:对已交互的,新品 124/302800
模型四:前一天加购物车的 51/1027
二、正例从何而来
全正例
三、业务熟练
发现加很多购物车的用户第二天的确买了很多,但他们买的不是昨天加购物车的商品
冲动型客户
用户分类:看了再买,买了再买
有些类型的商品可被同时购买多件
对从未在商品子集上购买商品,但在商品全集上购买过的用户的处理
12-12的数据怎么办
计算转化率时要去掉
如何利用前几天的购物车
一个人很多购物车,会买哪个?
四、观察算法结果
在此商品上行为多反而概率低。
新品的存在,且新品占了大部分
五、一些数据
504
商品:
160件已交互-36件以前被买过,124件以前没被买过-7件属于二次购买,143件不属于
344件未交互-94件以前被买过,250件以前没被买过
商品类:
213件不属于二次购买,47件属于二次购买,144件未交互品牌
58/1232
去掉当天购买的58/1033
+从未买过用户 47/954
去掉当天购买同类的58/930
当天已买过 4/100
大用户,转化率低于 4/100
转化率低于 10/281
几天购物车
50-64-67