源码地址:https://github.com/adbrebs/taxi
paper地址:http://arxiv.org/abs/1508.00021
这是2015 kaggle ECML/PKDD(https://www.kaggle.com/c/pkdd-15-predict-taxi-service-trajectory-i/data)获胜队伍开源的代码。
##依赖包
*Theano
*Blocks
*Fuel
*scikit-learn
##代码框架
*config/*.py:实验中不同模型的配置文件
*data/*py:数据管道相关的一些文件
-*__init__.py:包括数据的大体统计
-*csv_to_hdf5.py:将csv文件转化成hdf5文件,使得可以被Fuel直接使用
-*hfd5.py:一些通用的函数用来开采hdf5文件
-*init_valid_cut.py:初始化hdf5文件,使其可被验证集使用
-*make_valida_cut.py:通过一系列的时间切分生成验证集
-*transformers.py:使用Fuel pipeline,使训练集能够转化成模型可用的结构