强化学习

最新推荐文章于 2022-05-29 15:18:00 发布

qq_48590424

最新推荐文章于 2022-05-29 15:18:00 发布

阅读量135

点赞数

文章标签：强化学习

本文链接：https://blog.csdn.net/qq_48590424/article/details/120888739

版权

该博客介绍了如何使用PaddlePaddle框架实现强化学习的Actor-Critic模型，针对CartPole-v0环境进行训练。通过定义Actor和Critic网络结构，结合Adam优化器进行迭代训练，并保存模型参数。

摘要由CSDN通过智能技术生成

import gym, os

from itertools import count

import paddle

import paddle.nn as nn

import paddle.optimizer as optim

import paddle.nn.functional as F

from paddle.distribution import Categorical

device = paddle.get_device()

env = gym.make("CartPole-v0") ### 或者 env = gym.make("CartPole-v0").unwrapped 开启无锁定环境训练

state_size = env.observation_space.shape[0]

action_size = env.action_space.n

lr = 0.001

class Actor(nn.Layer):

def __init__(self, state_size, action_size):

super(Actor, self).__init__()

self.state_size = state_size

self.action_size = action_size

self.linear1 = nn.Linear(self.state_size, 128)

self.linear2 = nn.Linear(128, 256)

self.linear3 = nn.Linear(256, self.action_size)

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

关注关注