时间安排 |
大 纲 |
具体内容 |
实操案例 |
|
三天 |
关键点 |
1.强化学习的发展历程 2.马尔可夫决策过程 3.动态规划 4.无模型预测学习 5.无模型控制学习 6.价值函数逼近 7.策略梯度方法 8.深度强化学习-DQN算法系列 9.深度策略梯度-DDPG,PPO等 |
||
第一天 9:00-12:00 14:00-17:00 |
一、强化学习概述 |
1.强化学习介绍 2.强化学习与其它机器学习的不同 3.强化学习发展历史 4.强化学习典型应用 5.强化学习基本元素 |
深度强化学习与迁移学习核心技术的开发与应用
最新推荐文章于 2024-06-14 11:22:30 发布