参考文献: 1. Python Deque 模块使用详解 2. OpenAI Gym Documentation 3. OpenAI Gym 入门与提高(一) Gym环境构建与最简单的RL agent 4. 150行代码实现DQN算法玩CartPole