强化学习框架 PARL(一)

本文介绍了PaddlePaddlePARL框架,一个用于定义网络结构、算法实现和环境交互的工具。文章指导读者如何下载安装并通过运行`train.py`进行测试,展示了其在强化学习中的应用。
摘要由CSDN通过智能技术生成

parl是一款轻量级强化学习框架,发辫用户自定义算法https://github.com/PaddlePaddle/PARL

框架的结构如下

框架结构

  • Model:主要用来定义网络结构

  • Algrorithm:算法的具体实现

  • Agent:负责与环境交互产生数据

一 下载安装

直接执行

 
 

pip install parl

二 测试

下载原文件,找的examples\QuickStart\train.py,运行结果如下

运行结果

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值