- 博客(1)
- 收藏
- 关注
原创 抛开数学公式理解DDPG
由于新冠疫情被关在家中,无事可做.就决定用这段时间研究一下连续控制的深度学习算法DDPG. 网上看了很多帖子,大多上来就列公式.对于我这种数学基础差的同学,很不友好.于是打算丢开数学公式讨论一下DDPG的核心思想. 应用场景 DDPG用于连续控制系统,比如,OpenAI的MountainCarContinuous. 在游戏中玩家可以对小车提供一个向左向右或大或小的力,最终把小车推到最右端的小旗处....
2020-03-01 20:49:29
828
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人