- 博客(1)
- 收藏
- 关注
原创 【强化学习】基本知识梳理
文章目录前言一、基本概念二、使用步骤1.引入库2.读入数据总结前言对强化学习的基础的一些总结,防止自己容易遗忘一、基本概念1、Reward:记作Rt,一般代表t时刻的奖励值、回报值(强化学习中所有目标都可以用预期累积回报的最大化来描述)2、在某一个时刻,agent执行动作At、环境传来的二、使用步骤1.引入库代码如下(示例):import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport
2022-04-04 23:38:47
3254
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人