自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

weixin_44025954的博客

原创 DMC安装和使用

首先得安装Mujoco参考。

2023-07-01 10:59:50 192

原创 Dreamer-V2论文阅读

Dreamer-v2是一个model-based rl 算法，

2023-06-25 20:18:48 269 3

原创【无标题】

RLHF基本原理和DPO论文阅读RLHF基本原理LLM先进行有监督的微调学习一个reward model强化学习微调强化学习算法经常采用ppo算法，可以将reward funtion写为：DPO算法

2023-06-15 14:30:26 77 1

原创 git常用命令

git initgit add .git commit这是个多功能命令，可以开始跟踪新文件，可以将文件放入暂存区，也可以在合并分支时将冲突的文件标志为解决状态。git commit -m “message”git commit -a (先暂存再提交)克隆一个远程仓库，自动关联git fetch origin会抓取远程仓库的新推送的所有工作到本地，但是并没有合入当前工作。拉取远程分支并合入当前分支将当前分支推送到远程分支git push origin mastergit commit会指向父对象

2023-06-14 16:12:14 64

原创 docker常用命令

连接一个已经启动的容器，并且退出后容器不关闭：exit退出。

2023-05-18 17:13:45 49 1

原创电脑向linux服务器传输文件

scp:

2023-05-14 16:25:34 36

原创 linux服务器连接外网

对wget有用，对apt-get无效。

2023-05-14 16:15:15 217

原创 MEPG论文阅读

论文阅读

2022-10-30 15:02:12 126

原创 Exploration by distributional rl

对distributional rl的exploration

2022-10-25 13:08:59 87

原创 tf.greater(),tf.where()函数用法

2022-01-06 17:57:15 369

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

weixin_44025954 CSDN认证博客专家 CSDN认证企业博客

码龄5年

IP 属地：广东省

IP属地以运营商信息为准，境内显示到省（区、市），境外显示到国家（地区）

10: 原创

139万+: 周排名

32万+: 总排名

1485: 访问

: 等级

108: 积分

1: 粉丝

0: 获赞

5: 评论

0: 收藏

私信

关注

热门文章

最新评论

Dreamer-V2论文阅读
普什清决: 你好，有复现的文章或者资源吗？复现过程中遇到一些问题
Dreamer-V2论文阅读
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
【无标题】
CSDN-Ada助手: 恭喜您写了第八篇博客！虽然这篇博客没有标题，但是内容一定不错。您的创作精神值得我们学习和借鉴。希望您能继续保持创作的热情，不断提高自己的写作技巧。下一步的创作建议是，可以从日常生活中发掘灵感，写出更加贴近生活的文章。祝你写作愉快！ CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply8 看奖励名单。
docker常用命令
CSDN-Ada助手: 恭喜您写出了一篇非常实用的博客，介绍了docker常用命令，对于学习docker的初学者来说非常有帮助。接下来，建议您可以继续深入探索docker的其他功能，比如docker的网络管理、镜像管理等方面，这样可以更加全面地掌握docker的使用。期待您的下一篇博客！ CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply6 看奖励名单。
linux服务器连接外网
CSDN-Ada助手: 恭喜您写了这篇有用的博客，对于想要连接linux服务器到外网的人来说，这篇文章肯定会非常有帮助。我希望您能够继续保持创作的热情，为大家带来更多优质的内容。建议您可以尝试写一些关于服务器安全性或者网络优化的话题，这些内容也是非常有价值的。谢谢您的分享！ CSDN 会根据你创作的前四篇博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply4 看奖励名单。

最新文章

提示

确定要删除当前文章？

取消删除