淘宝购买预测——logistic回归,决策树,随机森林

数据是用户在商品全集上的移动端行为数据(D),表名为tianchi_fresh_comp_train_user_2w,包含如下字段:
user_id : 用户标识
item_id : 商品标识
behavior_type : 用户对商品的行为类型,包括浏览、收藏、加购物车、购买,对应取值分别是1、2、3、4
user_geohash : 用户位置的空间标识,可以为空,由经纬度通过保密的算法生成
item_category : 商品分类标识
time : 行为时间,精确到小时级别

1、预测效果并不好,可能是因为特征只选择了前一天的四种行为的次数,如果选择前一周或者更多天的数据应该会更好,离得越近的数据权重设置越高,越远的权重越低。
2、用户位置和商品分类信息不知道怎么用

# -*-coding:utf-8 -*-
__author__ = 'Bai'
import os, numpy as np,math
os.chdir('C:/Bai/taobao/fresh_comp_offline')
f = open('tianchi_fresh_comp_train_user.csv')
context = f.readlines()

##feature
u_dic = [{} for i in range(4)]
for line in context:
    line = line.replace('\n','')
    array = line.split(',')
    if array[0] == 'user_id':
        continue
    time = array[-1].replace(' ','-')
    time = 
  • 3
    点赞
  • 35
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值