自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(19)
  • 收藏
  • 关注

原创 [论文阅读] 3D感知相关论文简单摘要

提出了一个双分支网络,即一个以单目深度线索为目标,而另一个利用多视图几何结构,AFNet,它由三个部分组成,即单视图深度模块、多视图深度模块和自适应融合模块。通过使用这样的置信度图来执行逐像素融合,可以最终实现更稳健的深度。动态选择两个分支之间的高置信度区域执行融合。

2024-04-27 01:38:18 87

原创 [论文阅读链接]

仿真工具:dm_control: Software and Tasks for Continuous Control。

2024-04-20 22:41:39 345 1

原创 [论文阅读] CyberDemo: Augmenting Simulated Human Demonstration for Real-World Dexterous Manipulation

cyberdemo,这是一种新的机器人模仿学习方法,它利用模拟人类演示 simulated human demonstrations来完成真实世界的任务。通过在模拟环境中结合广泛的数据增强,cyberdemo在转移到现实世界时,处理不同的物理和视觉条件,优于传统的领域内真实世界演示。对以前未见的对象表现出可推广性首先,我们在模拟环境(蓝色区域)中收集人类演示,然后在模拟器(黄色区域)中进行广泛的数据扩充。然后,在增强数据上训练并在一些真实数据上微调的模仿学习模型可以部署在真实的机器人上。

2024-04-20 01:37:09 668

原创 [论文阅读] Learning Agile Soccer Skills for a Bipedal Robot with Deep Reinforcement Learning

通过真实环境中的运动捕捉设置获得的游戏状态信息包括agent的速度、球的位置和速度、对手的位置和速率以及两个进球的位置,这使得agent能够推断其全局位置。特别是,我们使用deep-rl来训练低成本的现成机器人,使其能够踢多机器人足球,远远超出了这种机器人的敏捷性和流畅性水平。结果还表明,通过适当的正则化、领域随机化和训练过程中注入的噪声,即使对于低成本的机器人,安全的sim-to-real转移也是可能的。我们发现,足够高频的控制、有针对性的动力学随机化和模拟训练过程中的扰动相结合,可以实现高质量的转移。

2024-04-14 01:15:04 913 1

原创 [论文阅读] RSS2023 Paper Sessions概况

一、Human-Centered Robotics Follow my Advice: Assume-Guarantee Approach to Task Planning with Human in the Loop: Autonomous Justification for Enabling Explainable Decision Support in Human-Robot Teaming:人机协作中自动agent提供可解释的建议 Enabling Team of Teams: A

2024-03-05 00:08:08 1197 1

原创 [论文阅读] Domain Randomization for Transferring Deep Neural Networks from Simulation to the Real World

域随机化的目的是在训练时提供足够的模拟可变性,以便在测试时模型能够推广到真实世界的数据。检测器在训练时无法获得感兴趣物体的颜色,只能获得它们的大小和形状。使用MuJoCo物理引擎的内置渲染器渲染图像。,我们的目标是训练将单个单目相机帧。映射到每个对象的笛卡尔坐标。给定一些感兴趣的对象。

2024-03-03 23:39:40 385 1

原创 [论文阅读] Learning ambidextrous robot grasping policies

通用拾取Universal picking (UP)或可靠的机器人抓取堆中各种新对象,是机器人的一大挑战传感器噪声和遮挡使物体在环境中的确切几何形状和位置模糊不清,不精确的驱动和校准会导致手臂定位不准确UP的一种方法是创建一个三维物体模型的抓取数据库,使用从几何和物理中获得的抓取性能指标,随机抽样来建模不确定性需要感知系统将传感器数据注册到已知物体上,并且在实践中不能很好地推广到各种各样的新物体。

2024-03-03 17:20:58 714

原创 [论文阅读] RoboCLIP: One Demonstration is Enough to Learn Robot Policies

奖励规范Reward specification 是强化学习中一个众所周知的难题,需要广泛的专家监督才能设计出稳健的奖励函数,模仿学习(IL)方法利用专家演示来规避这些问题,但通常需要大量的领域内专家演示受视频和语言模型(VLM)领域进展的启发,我们提出了RoboCLIP,这是一种在线模仿学习方法,它使用视频演示或任务文本描述形式的单一演示(克服了大数据需求)来生成奖励,而无需手动奖励功能设计RoboCLIP还可以利用域外演示,比如人类解决任务的视频来生成奖励。

2024-03-02 23:48:48 802

原创 [论文阅读] Learning Complex Dexterous Manipulation with Deep Reinforcement Learning and Demonstrations

灵巧的多指手操作由于高维数和大量的潜在接触,有效地控制仍然具有挑战性。我们证明了无模型DRL可以有效地扩展到高维24自由度手的复杂操作任务通过使用少量的人工演示,可以显著降低样本复杂性,这使得学习的样本量相当于几个小时的机器人经验使用演示导致policy表现出非常自然的运动,和鲁棒性用行为克隆对策略进行预训练,然后用策略梯度进行微调,并增加损失以接近演示,大大降低了样本复杂性,使训练能够在相当于真实世界机器人几个小时的时间内进行。

2024-02-29 00:07:48 553 1

原创 [论文阅读] Learning Dexterous Manipulation Policies from Experience and Imitation

基于学习的方法,用于对灵巧五指手进行非抓握操作的反馈控制学习得到能够从预定义的初始状态开始执行任务的本地控制器控制器是利用直接从传感器数据中学习到的局部线性时变模型locally-linear time-varying models 的轨迹优化 trajectory optimization 来构建的对于有一些初始条件的初始状态,可以在模拟和物理平台上稳健地执行任务还用两种插值 interpolation 方法来对更多的初始条件进行泛化:深度学习和最近邻 nearest neighbors。

2024-02-29 00:04:47 1490

原创 [论文阅读] RoboCat: A Self-Improving Generalist Agent for Robotic Manipulation

提出了一种用于机器人操作的多实施例 multi-embodiment 、多任务广义agent RoboCat,一个 visual goal-conditioned decision transformer ,输入actionlabelled visual experience。展示了泛化到新任务和新机器人的能力,无论是zero-shot还是通过目标任务的100-1000个示例进行适应展示了如何使用训练好的模型本身来为后续的训练迭代生成数据,为自主改进循环提供基本的构建模块。

2024-02-27 23:23:43 419 1

原创 [论文阅读] RT-1: ROBOTICS TRANSFORMER FOR REAL-WORLD CONTROL AT SCALE

通过从大型、多样化的任务识别数据集转移知识,现代机器学习模型可以解决特定的下游任务,无论是。虽然这种能力已经在计算机视觉、自然语言处理或语音识别等其他领域得到了证明,但它仍有待于机器人领域的展示,因为难以收集真实世界的机器人数据,因此模型的泛化能力尤其关键 the generalization capabilities of the models are particularly critical。

2024-02-26 14:27:51 1341

原创 [论文阅读]-Learning Fine-Grained Bimanual Manipulation with Low-Cost Hardware

精细操作任务,例如螺纹电缆连接或安装电池,对于机器人来说是非常困难的,因为它们需要精确、仔细协调接触力和闭环视觉反馈 precision, careful coordination of contact forces, and closed-loop visual feedback。执行这些任务通常需要高端机器人、精确的传感器或仔细的校准,这可能昂贵且难以设置。学习能否实现低成本和不精确的硬件来执行这些精细的操作任务?

2024-02-24 18:44:10 828 2

原创 Chapter 5 Velocity Kinematics and Statics

在前一章中,我们看到了如何计算给定一组关节位置的机器人末端执行器框架的位置和方向。在这一章中,我们研究了从一组给定的关节位置和速度计算开链末端执行器 twist 的相关问题。在我们将末端执行器扭转表示为V∈R6之前,从5.1节开始,让我们考虑这样一种情况,即末端执行器的构型由坐标的最小集合表示,速度由给出。在这种情况下,正运动学可以写成其中θ∈Rn是关节变量的集合。根据链式法则,t时刻的时间导数是其中J(θ)∈Rm×n称为雅可比矩阵。雅可比矩阵表示末端执行器速度对关节速度的。

2023-09-22 17:50:03 55

原创 Chapter 4 Forward Kinematics

机器人的正向运动学是指根据其关节坐标θ计算其末端执行器框架的位置和方向。图4.1说明了3R平面开放链的正向运动学问题。链路长度为L1、L2和L3。如图所示,选择一个原点位于基关节的固定框架{0},并假设末端效应器框架{4}已附着到第三个链接的尖端。末端执行器框架的笛卡尔位置(x,y)和方向φ作为关节角度(θ1,θ2,θ3)的函数,由下式给出如果只对末端执行器的(x,y)位置感兴趣,则将机器人的任务空间视为x–y平面,并且正向运动学仅由方程(4.1)和(4.2)组成。

2023-09-09 17:04:28 209

原创 MR chapter 3 Rigid-Body Motions

使用图3.19和几何结构,我们可以将对应于关于轴S的角速度的twist(由表示)写成请注意,线速度v是两项的总和:一项是由于沿螺杆轴的平移,另一项是由绕轴旋转引起的原点处的线性运动,第一个项在方向上,而第二个项在与方向垂直的平面上。不难证明,对于任何,其中,存在一个等效的螺杆轴和速度,其中,选择并取q,使得项提供v与螺杆轴正交的部分。如果ω = 0,则螺杆的螺距h是无限的。在这种情况下,选择,并将解释为沿的线速度‖v‖。代替用麻烦的集合。

2023-09-06 17:15:13 130

原创 MR chapter 2 Configuration Space

机器人是通过使用各种类型的joints将一组称为links的bodies相互连接来机械构建的。本书中考虑的所有机器人都有可以建模为刚体的链接links。由于机器人的链接是刚性的,并且已知形状,因此只需要几个数字来表示其配置 configuration。例如,门的配置可以由单个数字表示,即其铰链的角度 θ。机器人的自由度 degrees of freedom ((dof) 的数量是表示其配置所需的实值坐标的最小数量。定义:包含机器人所有可能配置的 n 维空间称为配置空间 (C-space)。

2023-08-29 10:17:37 201

原创 Modern robotics Appendix E

实数向量的欧几里得范数为。

2023-08-04 18:37:18 98

原创 使用EAS2配置elmo驱动器与maxon电机

3、手调电流环才能用的可能性比较大,V&P参数当某次模型辨识准确可能不需要调整即可实现正常的跟踪性能,但效果不行时也可以改掉automatic手搓参数。选带gear的之后可以选择loop feedback configuration中的反馈类型,编码器反馈是在电机端还是在负载端。4、电流环始终存在静差,发现是供电问题,将并联的另外一个驱动器拔电就正常了。对于使用的小负载情况的电机,选择降低测试电流等级和减小电流设置的思路测试。1、由以前经验,将电流限上限调低,调整电流环,达到上面跟随水平。

2023-08-02 18:07:35 504

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除