1、下载avazu数据集,可以选择Download ALL下载3个文件的压缩包,也可以只下载train.gz。然后将压缩文件上传到服务器上,在服务器上进行解压(因为本地解压后文件体积较大,上传很慢)。
2、如果是选择Download ALL下载3个文件,会得到一个avazu-ctr-prediction.zip,使用如下命令进行解压:
unzip avazu-ctr-prediction.zip
命令执行结果:
3、得到train.gz后,使用如下命令进行解压:
gunzip train.gz
得到的train就可以直接读取用于训练了:
注,这里的gunzip命令不会保留源压缩文件。如果需要保留,则可以加上 -k 参数。详见Linux gunzip 命令 | 菜鸟教程。