背景:星球联盟每日必做任务的推荐任务
数据预处理:前三周的数据--------->最后一周的数据
表:曝光表,点击表,完成表,每日必做任务表。
特征工程:
"customer_click_rate" : user点击率
"customer_finish_rate": user完成率
"task_click_rate": 任务点击率
"task_finish_rate": 任务完成率
"task_type": 任务类型,是否为安装任务
"value_int": 每日必做任务表的value
"value_unit":
"finish_num":
"finish_type":
"refill":
"rating": 交叉特征,是ALS算法的预测结果。
分类器:
GBTClassifier(labelCol="label", featuresCol="features", maxIter=10)
排序:
将所有预测结果为1 的,按后验概率进行排序。
结果输出:
有预测结果但推荐数目不足9个的,用最热商品补足。最热商品即为完成率最高的商品。
没有推荐结果的,直接使用最热商品作为推荐结果。
大概56w用户有推荐结果,30w没有。
上线测试结果:
我的算法编号:613023
baseline:613008
整体效果较好,基本追上613008