自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 openrlhf中PPO算法agent的定义及调用

本文深入解析了OpenRLHF框架中PPO算法如何通过Ray分布式系统调用agent生成训练数据的过程。文章分为四个部分:首先追溯PPO训练主程序如何调用agent(vllm_engines);其次分析agent生成experience的流程;然后阐述基于Ray的vllm_engines部署和调用机制;最后说明agent的自定义实现方式。

2025-09-17 18:29:34 560

原创 图形学入门基础

简单的图形学知识。

2023-07-09 09:07:55 120 1

原创 山东大学,机器人学导论,第五章知识点整理(简要版)

直角空间描述的特点:路径可控且可预知,直观容易地看到机器人末端执行器的轨迹,但计算量大,容易出现奇异点。将轨迹分成若干段,使机器人的运动经过这些中间点,在每一点都求解机器人的关节变量,直到达到终点。所有关于关节空间轨迹规划的方法都可用于直角坐标空间的轨迹规划。关节空间法:以关节角度的函数来描述机器人归集的方法。轨迹:在路径的基础上,强调到达任意一点的时间。额外:指定运动段的起点和终点的加速度。抛物线过渡的线性运动轨迹。直角坐标空间的轨迹规划。三次多项式的轨迹规划。五次多项式的轨迹规划。

2023-05-25 16:58:22 489 1

原创 python基本数据结构以及语法

python小白学习语法

2023-04-25 10:57:34 1054 2

Influential Recommender Systemk论文笔记

Influential Recommender Systemk论文笔记

2025-08-26

计算机图形学期末考试汇总

图形学入门课程

2023-07-09

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除