增强学习入门之Q-Learning

最新推荐文章于 2025-03-12 16:36:29 发布

「已注销」

最新推荐文章于 2025-03-12 16:36:29 发布

阅读量1.6w

点赞数 8

分类专栏：机器学习文章标签：机器学习神经网络深度学习数据科学增强学习

本文链接：https://blog.csdn.net/lcy7289786/article/details/68957856

版权

本文介绍了增强学习的基本概念，通过“熊瞎子掰苞米”的故事阐述了决策优化的重要性。文章以Q-Learning为例，解释了Q-table的构建、更新过程，并通过一个小迷宫的案例展示了Q-Learning如何训练Agent进行决策。最后提到了深度增强学习是将神经网络应用于Q-Learning，以实现更复杂的决策策略。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

本文首发于集智：https://jizhi.im/blog/post/intro_q_learning

“机器学习”的话题一直很火热，相关的概念也是层出不穷，为了不落后于时代，我们都还是要学习一个。

第一次听到“增强学习”(Reinforcement Learning)的时候，我以为只是在“深度学习”的基础上又玩儿的新花样。后来稍微了解了一下，发现其实是完全不同的概念，当然它们并非互斥，反而可以组合，于是又有了“深度增强学习”(Deep Reinforcement Learning)。

这让人不由得感慨起名的重要性，“增强”这个名称就给人感觉是在蹭“深度”的热点，一个下五洋，一个上九天。而“卷积神经网络”(Convolutional Neural Network)这个名字就好的多，其实这里的“卷积”跟平时说的那个卷积并不是一回事，但是就很有科技感、Geek范。更好的还有“流形学习”(Manifold Learning)，洋溢着古典人文主义气息。

天地有正气，杂然赋流形。——文天祥《正气歌》