DCRNN安装与配置完全指南
项目基础介绍及主要编程语言
DCRNN (Diffusion Convolutional Recurrent Neural Network) 是一个基于TensorFlow实现的深度学习模型,专为交通流量预测设计。它由Yaguang Li等人提出,并在2018年的国际学习表征会议(ICLR)上发表。此项目采用Python为主要编程语言,特别是在TensorFlow 1.x版本上构建。
项目使用的关键技术和框架
- 深度学习框架: TensorFlow
- 关键技术: 引入扩散卷积和循环神经网络(RNN),结合图神经网络的概念,以处理具有空间依赖性的时序数据。
- 数据驱动: 利用实际交通数据集(METR-LA与PEMS-BAY)进行训练和评估。
- 预处理与后处理: 包括HDF5文件处理、图构造、数据切分等辅助工具。
安装和配置详细步骤
环境准备
确保你的系统已安装以下软件:
- Python >= 3.6
- TensorFlow >= 1.3.0
- Other dependencies:
scipy
,numpy
,pandas
,pyaml
,statsmodels
步骤1:创建虚拟环境(可选但推荐)
在终端中创建一个新的虚拟环境,以便隔离项目依赖。
python3 -m venv dcrnn-env
source dcrnn-env/bin/activate
步骤2:安装依赖项
通过pip安装所有必需的库。
pip install -r https://raw.githubusercontent.com/liyaguang/DCRNN/master/requirements.txt
获取项目源码
克隆DCRNN项目到本地。
git clone https://github.com/liyaguang/DCRNN.git
cd DCRNN
数据准备
你需要下载Los Angeles(METR-LA)和Bay Area(PEMS-BAY)的交通数据文件,这些可以通过Google Drive或Baidu Yun获取。之后,将它们放在data/
目录下,文件名应为metr-la.h5
和pems-bay.h5
。
创建数据集
运行脚本来生成训练、测试和验证数据集。
mkdir -p data/METR-LA data/PEMS-BAY
python -m scripts.generate_training_data --output_dir=data/METR-LA --traffic_df_filename=data/metr-la.h5
python -m scripts.generate_training_data --output_dir=data/PEMS-BAY --traffic_df_filename=data/pems-bay.h5
图构造
对于LA的数据,项目已经提供了传感器距离信息,因此可以直接生成图的邻接矩阵。
python -m scripts.gen_adj_mx --sensor_ids_filename=data/sensor_graph/graph_sensor_ids.txt --normalized_k=0.1 --output_pkl_filename=data/sensor_graph/adj_mx.pkl
运行预训练模型(验证安装)
为了快速验证是否正确设置,你可以尝试运行预训练的模型。
python run_demo.py --config_filename=data/model/pretrained/METR-LA/config.yaml
或者针对PEMS-BAY:
python run_demo.py --config_filename=data/model/pretrained/PEMS-BAY/config.yaml
开始自己的训练(高级步骤)
如果你希望从头开始训练模型,使用对应的配置文件。
python dcrnn_train.py --config_filename=data/model/dcrnn_la.yaml # 对于METR-LA
python dcrnn_train.py --config_filename=data/model/dcrnn_bay.yaml # 对于PEMS-BAY
至此,您已经成功安装并配置了DCRNN项目,可以开始探索其强大的时空预测能力了。
请注意,由于依赖的具体版本可能会随时间更新,建议在执行上述命令前查看项目的最新说明和可能的依赖更改。