- 博客(1)
- 收藏
- 关注
原创 2020百度强化学习培训体会
感谢美丽的科科老师,加班加点地用心备课和深入浅出的讲解,让我这个对强化学习一无所知的门外汉,也有机会登堂入室,一窥强化学习的奥妙与强大。 几点感受 一、相对于保守安全的SARSA算法(也许是我功夫还不到吧,在CliffWalking游戏中,虽然agent每次都成功的避开了悬崖旁边的危险路径,但经常是运行结果大不相同),我更喜欢极具冒险精神的Q-learning算法,每次只选择未来获取奖励最高的策略,每次都坚定的走临近悬崖的最近的路; 二、还有经典的DQN算法,开创了神经网络与强化学习巧妙结合,将强化学习的应
2020-06-24 20:09:53 332
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人