处理阿里天池 AliCCP数据集的时候,训练集一共有4千万个样本。处理起来非常费劲,尝试了很多种办法,数据预处理特别耗时,数据预处理跑完预计一天一夜。这里学习一下别人的处理方式:
https://github.com/lambdaji/tf_repos/tree/master/DeepMTL
开启多线程数据处理。
处理阿里天池 AliCCP数据集的时候,训练集一共有4千万个样本。处理起来非常费劲,尝试了很多种办法,数据预处理特别耗时,数据预处理跑完预计一天一夜。这里学习一下别人的处理方式:
https://github.com/lambdaji/tf_repos/tree/master/DeepMTL
开启多线程数据处理。