强化学习
文章平均质量分 92
此时@此刻
这个作者很懒,什么都没留下…
展开
-
[完结]工程师谈强化学习5 _克服强化学习中的实际问题
在本节中,我将解决一些不太容易注意到的进入生产部署环节的强化学习问题,并尝试提供一些方法来缓和这些问题。即使没有直接的方法来解决你将面临的一些挑战,至少会让你去思考这些挑战。这篇文章将探讨验证学习解决方案中可能面临的困难,找出失败的原因并手动调整策略。同时我们也将探讨一些变通的方法来提高策略的鲁棒性和安全性。最后,我们还将展示如何使用强化学习来学习传统控制系统中的参数,以及为什么这是一种两全其美的方法。...原创 2022-08-15 12:52:26 · 622 阅读 · 0 评论 -
工程师谈强化学习4 _行走机器人示例
本节中,将展示如何利用强化学习工作流,设置智能体使双足机器人行走。以及如何修改此示例增加参考信号,使它看起来和设置传统控制问题的过程更相似。文章中还将考虑强化学习智能体如何取代部分传统控制系统,而不是完整端到端设计。最终,也将说明此设计的一些局限性。...原创 2022-08-14 18:38:36 · 1211 阅读 · 0 评论 -
工程师谈强化学习3 _了解策略和学习算法
在本节中,我们将介绍基于智能体的算法函数,并探讨为什么要用神经网络来表示函数,为什么要建立两个神经网络,以及它们在强大的称为“执行器一评价器”的系列方法中如何互补。原创 2022-08-13 17:10:16 · 278 阅读 · 0 评论 -
工程师谈强化学习2 _了解环境与奖励
在本篇文章中,我们将通过探索强化学习的工作流来进一步了解强化学习的基本知识。我们将探讨什么是环境,以及通过模拟仿真环境来实现训练的一些优势。我们也将探讨我们最终希望只能提做什么,并设计奖励函数来激励智能体,按照期望执行任务。我们还将探讨选择一种表示策略的方法的需求——我们希望如何构造智能体,即决策部分包含的参数和逻辑。...原创 2022-08-12 16:20:07 · 440 阅读 · 0 评论 -
工程师谈强化学习1 _什么是强化学习?
在这篇文章中,将通过一个工程师的角度来介绍什么是强化学习。强化学习是一种机器学习方法,它有潜力解决一些非常困难的控制问题。原创 2022-08-11 16:49:11 · 393 阅读 · 0 评论