土不小子亥-CSDN博客

原创 InsertionNet - A Scalable Solution for Insertion 论文阅读

论文地址：InsertionNet - A Scalable Solution for Insertion | IEEE Journals & Magazine | IEEE Xplore原来是说，强化学习在学习残余策略的过程中会带来磨损和安全性的问题（关于residual RL大家可以自行学习）。所以打算用回归的方式学习这个残余策略。但是回归数据采集过程不是也会有磨损之类的嘛（笑）？只能说能对上述磨损和安全性问题进行一定程度的限制。...

2022-06-30 20:12:57 120 2

原创 A Robotic Grasping State Perception Framework with Multi-Phase Tactile Information 论文阅读

在相对少量的抓取数据的情况下，如何提高机械手预测抓取稳定性以及预测抓取滑落的准确率。创新点是什么？为了解决上述问题，作者提出了一套多阶段多输出的预测模型，同时用6种网络结构和6种集成模式进行集成学习。...

2022-06-09 16:51:15 113

原创 [ICRA 2022]Offline Learning of Counterfactual Predictions for Real-World Robotic RL论文阅读

强化学习仍遭受训练效率、普及化、安全的在线探索、sim-to-real以及稀疏奖励学习的问题。因此作者提出一套方法，能够使得强化学习能在一小段时间学完，同时奖励函数还是以稀疏的方式定义。首先，作者给我们灌输了一个“感知即预测”的观念。我自身是赞成也能理解这个观念的。有很多人将动态系统的建模与对系统未来状态的预测画上等号。在现代控制理论的状态空间建模方式中，也能对此窥见一二。......

2022-06-07 16:17:14 175

原创 [ICRA2022] Interactive Robotic Grasping with Attribute-Guided Disambiguation论文阅读

浅读论文，仅代表个人观点，欢迎交流。文章要解决的核心问题便是语言带来的歧义问题。具体来讲（如下图），当我们给出语言指令时，框选的三个物体得分近似难以准确定位到抓取目标。首先，上述问题并非没有人去解决，一种很自然的想法是通过进一步的人机交互获得目标物体的相关信息，从而进行定位。本文聚焦到通过语言的问答这种获取信息的方式。我们希望这种问答的方式足够优雅，那便是问题要恰到好处，用最少的问题快速聚焦到目标物体上。基于此，...

2022-06-06 20:41:58 187

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人