主要思路
对用户id进行分组
统计类别、品牌、收藏、加购物车、下单等特征,赋予合理的权重
构建时间特征
使用lgb的多分类模型进行训练
主要代码:
注意:此版本代码lgb版本是2.0.3
import gc
import pandas as pd
from sklearn.preprocessing import LabelEncoder
paths = r'E:\项目文件\CCF\电商用户购买行为预测'
data = pd.read_csv(f'{paths}/train.csv')
submit_example = pd.read_csv(f'{paths}/submit_example.csv')
test = pd.read_csv(f'{paths}/test.csv')
data['user_id'] = data['user_id'].astype('int32')
data['product_id'] = data['product_id'].astype('int32')
data['category_id'] = data['category_id'].astype('int32')
lbe = LabelEncoder()
data['brand'].fillna('0', inplace=True)