自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 Paper阅读:Improved 3D Diffusion Policies

DP,DP(冻结RM3编码器),DP(微调RM3编码器),iDP3(DP3的编码器),iDP3(卷积编码器):分母为尝试次数,分子为成功次数。微调RM3编码器)表现比iDP3(卷积编码器)好,但是只是在训练和测试的场景一样的情况下,在新场景的泛化能力前者就不行了。2.以自己为中心的3D视觉表示,更大范围的点云输入、金字塔卷积视觉编码器、长时程预测。下列实验的DP就是DP(微调RM3编码器)。展现出了较大的泛化能力,但是仍然依赖于固定视角的精密校正摄像头和点云分割。学习使用,欢迎讨论!

2025-03-06 17:30:49 316

原创 机器人模仿学习的典型方法

BC-RNN是BC(behavior clone)中典型的网络结构,相比于使用MLP或者CNN完成状态到动作的映射,将network换成了RNN(循环神经网络),考虑条件序列(通常是指机器人状态,如末端位置,关节角度等)的序列相关性,解决传统BC的短视问题。一种特殊的BC-RNN,利用LSTM捕捉状态序列的时序信息,将LSTM的隐状态ht,通过全连接神经网络映射到GMM的参数上(包括均值、权重、协方差),这样拥有了动态GMM,对动作分布的拟合效果会更好,动作是从动态的GMM模型上采样得到的。

2025-03-06 17:26:45 603

原创 paper解读:3D diffusion policy

(1)空间泛化能力更强:可以更加充分地理解工作区域的空间分布。如下图,红色为是示范 点, 蓝色为算法可以成功到达的点(这里猜测这个蓝色点是人工设置想让机器人到达,并且机器 人成功达到的点)。(2)在点云编码器中引入LayerNorm(层归一化)能够规范化网络层的输出,缓解梯度消失或 爆 炸问题,从而提升训练的稳定性,尤其是在多任务场景中。(3)泛化能力更强:空间泛化泛化能力强、外观泛化能力(颜色)强、形态泛化能力强(物体形 状)、视角泛化能力强。

2025-03-05 10:56:19 344 2

原创 paper解读:diffusion policy

对动作信息的特征进行修饰,修饰后的特征经过连续的卷积神经网络, 得到当前状态和动作(带噪声)下的噪声,对当前动作(带噪声)去除噪声,生成更清晰的动 作,循环K次,生成动作。分类分布对于低维的动作,有一定的效果,但是当动作的维度变大以后,动作的类别呈指数上升。为了解决这一问题,研究人员将动作各维度信息进行解耦,针对每一维信息进行采样,然后组合成N维的动作,这样会产生很多本来不存在的动作模态,如{(1,2)(4,5)},解耦以后{(1,4),(1,5),(2,4)(2,5)}

2025-03-05 10:44:36 994 3

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除