- 博客(1)
- 收藏
- 关注
原创 【强化学习】基本知识梳理
文章目录前言一、基本概念二、使用步骤1.引入库2.读入数据总结 前言 对强化学习的基础的一些总结,防止自己容易遗忘 一、基本概念 1、Reward:记作Rt,一般代表t时刻的奖励值、回报值(强化学习中所有目标都可以用预期累积回报的最大化来描述) 2、 在某一个时刻,agent执行动作At、环境传来的 二、使用步骤 1.引入库 代码如下(示例): import numpy as np import pandas as pd import matplotlib.pyplot as plt import
2022-04-04 23:38:47 3231
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人