自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 DMC安装和使用

首先得安装Mujoco参考。

2023-07-01 10:59:50 192

原创 Dreamer-V2论文阅读

Dreamer-v2是一个model-based rl 算法,

2023-06-25 20:18:48 269 3

原创 【无标题】

RLHF基本原理和DPO论文阅读RLHF基本原理LLM先进行有监督的微调学习一个reward model强化学习微调强化学习算法经常采用ppo算法,可以将reward funtion写为:DPO算法

2023-06-15 14:30:26 77 1

原创 git常用命令

git initgit add .git commit这是个多功能命令,可以开始跟踪新文件,可以将文件放入暂存区,也可以在合并分支时将冲突的文件标志为解决状态。git commit -m “message”git commit -a (先暂存再提交)克隆一个远程仓库,自动关联git fetch origin会抓取远程仓库的新推送的所有工作到本地,但是并没有合入当前工作。拉取远程分支并合入当前分支将当前分支推送到远程分支git push origin mastergit commit会指向父对象

2023-06-14 16:12:14 64

原创 docker常用命令

连接一个已经启动的容器,并且退出后容器不关闭:exit退出。

2023-05-18 17:13:45 49 1

原创 电脑向linux服务器传输文件

scp:

2023-05-14 16:25:34 36

原创 linux服务器连接外网

对wget有用,对apt-get无效。

2023-05-14 16:15:15 217

原创 MEPG论文阅读

论文阅读

2022-10-30 15:02:12 126

原创 Exploration by distributional rl

对distributional rl的exploration

2022-10-25 13:08:59 87

原创 tf.greater(),tf.where()函数用法

2022-01-06 17:57:15 369

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除