无需公式或代码，用生活实例谈谈 AI 自动控制技术“强化学习”算法框架

最新推荐文章于 2024-08-15 12:48:48 发布

枇杷鹭

最新推荐文章于 2024-08-15 12:48:48 发布

阅读量2.3k

点赞数 3

分类专栏： Amazing-Brick Reinforcement Learning 文章标签：人工智能大数据强化学习深入浅出再励学习

本文链接：https://blog.csdn.net/weixin_42815609/article/details/105974702

版权

本文通过无需公式和代码的方式，深入浅出地讲解强化学习原理，以寒假作业为例，探讨如何利用强化学习帮助学生做出最佳决策。文中对比了监督学习和无监督学习，并解释了强化学习如何在不断试错中实现远视决策，最后介绍了强化学习的特点及其在实际问题中的应用。

摘要由CSDN通过智能技术生成

不用公式、不用代码，白话讲讲强化学习原理

The best way to learn is to teach others.

战胜围棋高手李世石的 AlphaGo ，称霸星际争霸2的 AIphaStar…这些先进的自动控制技术都离不开“强化学习”这个算法框架。有人说，强化学习是一种“试错”技术，是在状态与动作间建立了一种高级的“哈希映射”。学习强化学习半载，我个人的心得是：强化学习让实时决策不再“鼠目寸光”，本文我们就通过“小赛能否写完假期作业”这个生活实例来谈谈。

在说强化学习之前，我们先来聊聊他的两个兄弟：监督学习和无监督学习。