- 博客(1)
- 收藏
- 关注
原创 Q-learning一维寻宝
Q-learning一维寻宝实现 Q-learning 代码实现 import numpy as np import pandas as pd import time np.random.seed(2) N_STATES=6 ACTIONS=["left","right"] EPCILON=0.9 ALPHA=0.1 GAMMA=0.9 MAX_EPISODE=13 FRESH_TIME=0...
2020-02-11 15:53:09 506
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人