自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 Autonomous Reinforcement Learning via Subgoal Curricula 论文笔记

题目:基于子目标课程的自主强化学习Abstract 无1 Introduction强化学习为交互式智能体自主获取复杂行为提供了很好的契机,但当前强化学习算法的自主性仍面临挑战,尤其是在机器人领域:假设每次试验都从环境中特定状态分布的初始状态开始。传统地,强化学习算法假设能够任意采样并重置为从该分布中提取的状态,这使得此类算法对于大多数实际设置都不切实际。许多以前在真实机器人上进行强化学习的例子都依赖于机器人设置和人类监督的仪器,以使环境重置为该初始状态分布。额外的环境检测和创建脚本化行为都需要大量

2022-05-23 18:58:38 141

原创 MULTIPOLAR: Multi-Source Policy Aggregation for....论文笔记

MULTIPOLAR: Multi-Source Policy Aggregation for Transfer ReinforcementLearning between Diverse Environmental Dynamics 论文翻译笔记聚类是一种机器学习算法!!题目:多极:多源策略聚合,用于不同环境动态/环境动力学之间的迁移强化学习Abstract迁移强化学习(Transfer Reinformation learning,RL):通过利用其他来源的agent在相关任务中的知识来提高

2022-05-19 19:14:34 142 1

原创 Maddpg代码配置 Anaconda MPE

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录前言一、安装前准备二、开始配置前言记录下配置Maddpg所需环境及代码运行过程中遇到的问题。一、安装前准备下载maddpg和mpe环境安装包.maddpg:(网盘链接)https://pan.baidu.com/s/1Q0XYyUHTTKdxdqSSudXFuw?pwd=0hu5提取码:0hu5mpe:(网盘链接)https://pan.baidu.com/s/1lUDphlyhKualaOyFUkNNag?pwd.

2022-05-09 22:28:33 1235

原创 括号匹配 C语言

括号匹配c语言#include<stdio.h>#include<string.h>int main(){ int n,m;char s[100];char copys[100];scanf("%d%*c",&n);while(n–){gets(s);int i,j=0,k;int flag=0;int len=strlen(s);for(i=0;i<len;i++){if((s[i]’(’)||(s[i]’[’)||(s[i]’{

2021-03-16 20:48:13 158 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除