概念解析 | 无模型方法 (Model-Free Methods)

119 篇文章 94 订阅 ¥29.90 ¥99.00

注1:本文系“概念解析”系列之一,致力于简洁清晰地解释、辨析复杂而专业的概念。本次辨析的概念是:Model-Free Methods

概念解析 | 无模型方法 (Model-Free Methods)

在这里插入图片描述

A non-exhaustive, but useful taxonomy of algorithms in modern RL.

第一部分:通俗解释

在我们日常生活中,我们做决策时通常会依靠经验。例如,当你驾驶汽车时,你不会每次都去计算每个可能的路径,而是根据以往的经验和实时的路况信息来做出最优决策。这种方式类似于无模型方法 (Model-Free Methods) 在强化学习中的工作方式。

什么是无模型方法?

让我们用一个简单的比喻来理解。想象你是一名厨师,想要做一道你从未尝试过的新菜。你可以选择两种方法:

  1. 模型方法(Model-Based Methods):你可以详细研究每一种食材的特性,分析它们的化学成分,了解它们在

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

R.X. NLOS

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值