![](https://img-blog.csdnimg.cn/20201014180756923.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
DRL
文章平均质量分 84
梦里梦。。。
深度强化学习机器人导航的一个learner
展开
-
深度强化学习+大模型综述Survey on Large Language Model-Enhanced Reinforcement Learning
对 LLM 增强 RL 中现有文献进行了全面的回顾,并总结了其与传统 RL 方法相比的特征,旨在阐明未来研究的研究范围和方向。信息处理器、奖励设计者、决策者和生成器。LLM-enhanced RL是指利用预先训练的知识固有AI模型的多模态信息处理、生成、推理等能力来辅助RL范式的方法。利用具有一般知识的模型,这意味着与其他数据驱动模型相比,该模型在学习过程中具有相当大的能力水平和更好的泛化。此外,LLM 增强的 RL 仍然使用 AI 模型,并且可以通过 RL 交互数据持续学习以提高其能力。原创 2024-06-03 17:43:28 · 1078 阅读 · 0 评论 -
深度强化学习(Deep Reinforcement Learning, DRL)阶段性学习汇总(二)
介绍完深度强化学习的背景后,我们来看一下深度强化学习的发展历程,以及里程碑事件深度强化学习(Deep Reinforcement Learning, DRL)的发展历程是人工智能领域中的一个重要分支,它结合了深度学习和强化学习的优势。原创 2024-06-03 10:43:01 · 295 阅读 · 0 评论 -
深度强化学习(Deep Reinforcement Learning, DRL)阶段性学习汇总(一)
深度强化学习我所理解的其实质是通过策略函数(数学模型,在给定情况下,以深度学习网络作为策略网络,通过特征提取网络、回归网络或者分类网络,采取不同策略的概率或决策方式。)完成状态空间->动作空间的映射。原创 2024-05-06 21:40:59 · 655 阅读 · 0 评论