因为一直在看矩阵算法相关的文章,算法的研究陷入了瓶颈,所以想从数据上找找突破口。
欢迎做这个比赛的同学一起交流分享!
比赛官网 https://www.biendata.com/competition/icmechallenge2019/
2019年2月11日:发布测试集,开放测试集结果提交入口
2019年4月1日:参赛报名截止
2019年4月7日:测试集结果提交截止,计算排名
系统环境
win10、GPU1050ti、
安装环境
- Anaconda3-5.2.0-Windows-x86_64
- cuda_9.0.176_win10.exe
- cudnn-9.0-windows10-x64-v7.4.2.24.zip
- Pycharm专业版(使用学校邮箱有一年的免费权)
PS:
cuda9.0千万不能装错,之前电脑装过cuda9.1,安装tensorflow之后,一直出现错误
“ImportError: DLL load failed: 找不到指定的模块”
“Failed to load the native TensorFlow runtime”
按照这个顺序来装很顺畅,没有什么小问题,之后再用pycharm安装虚拟环境,不需要在cmd中用conda命令装tensorflow。
安装深度学习框架
Tensorflow 1.12 GPU版本
安装过程参考 https://blog.csdn.net/heros_never_die/article/details/79760616
比赛
因为没有服务器,所以选择了小数据量的Track2,baseline来自
https://github.com/shenweichen/Bytedance_ICME2019_challenge_baseline
把整个项目拉进安装了tensorflow的虚拟环境的位置,按照Github中配置一下所需的包即可。
到官网下载所需的数据集,放进input里,即可直接跑数据
效果
我的电脑(1050ti)跑了20分钟,提交的结果分数是0.770,一开始可以排到30多名,现在掉下去了。
下一步准备调参,把baseline里面用的算法(xDeepFM)学一下,尝试加入矩阵分解算法
baseline的代码简洁易懂,非常好理解(本人无任何python经验)
参考的baseline发布者大神的github shenweichen
以及大神的包DeepCTR的说明
https://deepctr-doc.readthedocs.io/en/latest/_modules/deepctr/models/xdeepfm.html#xDeepFM