论文阅读笔记《Training Deep Neural Networks for Visual Servoing》

最新推荐文章于 2024-10-18 10:41:41 发布

深视

最新推荐文章于 2024-10-18 10:41:41 发布

阅读量759

点赞数

分类专栏：论文阅读笔记 # 视觉伺服文章标签：视觉伺服深度学习

本文链接：https://blog.csdn.net/qq_36104364/article/details/112567681

版权

论文阅读笔记同时被 2 个专栏收录

259 篇文章

订阅专栏

视觉伺服

35 篇文章

订阅专栏

文章介绍基于深度学习的视觉伺服算法，从视觉伺服到直接视觉伺服，再到基于CNN的视觉伺服，通过最小化图像差异找最优位姿。利用神经网络学习完成优化，输入图像输出变换矩阵，用PBVS求速度控制律，确定了该算法范式，后续多在此基础改进。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

核心思想

该文应该是基于深度学习的视觉伺服算法中比较经典的一篇文章了，基本奠定了基于深度学习的视觉伺服算法的雏形。文章首先介绍了从视觉伺服（VS）到直接视觉伺服（DVS）的变化过程，其实就是将视觉伺服从一个利用几何关系和动力学关系求解控制律的过程，过渡到一个优化问题，通过最小化期望位置图像和当前位置图像之间的差异，来寻找最优的期望位姿。
在这里插入图片描述
而进一步发展到基于深度学习（CNN）的视觉伺服，就是利用一个神经网络，通过学习的方式来完成上述的优化过程，网络的输入是当前位置的图像和参考位置图像，输出则是两幅图像位姿之间的变换矩阵
在这里插入图片描述
$\Delta r_0$ 就表示变换矩阵 $^{c_0}T_c$
对于视觉伺服任务而言，要求得当前位置到期望位置的变换矩阵 $\Delta ^*r$ 也非常简单

这里不理解为什么非要用一个参考图像过渡一下，直接计算期望位置图像和当前位置图像之间的变换矩阵不好吗？网络的目标函数也很简单
在这里插入图片描述