2015阿里天池大数据竞赛-Solution

本文档记录2015年阿里天池大数据竞赛中的一个初步解决方案,分享基于规则的方法和简单的Python代码。代码已上传至GitHub,无需依赖项,通过预处理数据、应用规则和训练机器学习模型(未分享)来生成提交文件,可达到7.6%的F1分数。在现有基础上进行特征工程和模型改进,F1分数可提升至9%以上。建议在Linux环境下运行,第二赛季时需更新代码以适应大数据处理。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

竞赛介绍:链接

这篇文章记录2015阿里天池大数据竞赛中,我的一些代码,由于目前还在比赛中,仅分享一个naive solution,基于规则,代码主页在我的github上:链接,下面是代码说明。有兴趣的请看代码注释,恕不详述。

本repo目录说明

  • data 存放数据
  • preprocess 数据预处理
  • rule 根据规则生成提交文件
  • model 训练机器学习模型(暂时不分享)

代码使用说明

  • fork本repo,非Github用户请点右下角的Downlown ZIP

  • 解压后,将tianchi_mobile_recommend_train_user.csv以及tianchi_mobile_recommend_train_item.csv放入/data/目录下

  • 仅需两个步骤即可获得一份提交文件,F1可达到7.6%

    • 第一步,进入/preprocess/目录,运行data_preprocess.py
    • 第二步,进入/ru
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值