Kaggle下载Criteo数据集
1. 帐号准备
登陆Kaggle并注册帐号。
Account->API->Create New Token 生成配置文件 kaggle.json
。
2. Kaggle API安装
https://github.com/Kaggle/kaggle-api
$ pip install --upgrade kaggle
把第一步的 kaggle.json
放到/root/.kaggle/
下。
3. 下载数据
https://www.kaggle.com/c/criteo-display-ad-challenge/data
https://github.com/Kaggle/kaggle-api
$ kaggle competitions download -c criteo-display-ad-challenge
数据会下载到当前目录
下。
原始数据(1TB)已失效,实验可用:https://labs.criteo.com/2014/02/download-dataset/