视觉伺服研究学习——2021年10月

最新推荐文章于 2023-04-17 09:40:49 发布

幻魔大师-Rambo

最新推荐文章于 2023-04-17 09:40:49 发布

阅读量4.6k

点赞数 1

文章标签：深度学习计算机视觉

本文链接：https://blog.csdn.net/weixin_42460825/article/details/120870346

版权

这篇博客探讨了视觉伺服技术，包括基于位置和图像的伺服控制，以及机器人视觉系统的目标检测与定位方法。文章介绍了多种算法，如NCC、HOG特征和基于边缘信息的检测方法，并讨论了摄像机标定、图像金字塔、图像噪声处理和深度学习在视觉伺服中的应用。此外，还提到了基于CiteSpace的计算机视觉研究热点分析。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

一、基础学习课程

深度学习

计算机视觉

机器学习

约定：

黄色高亮表示关键词，不认识的知识点；

绿色下划线：重要的思想观点，精髓的理解。

二、论文学习

1、室内动态视觉SLAM算法研究硕士学位论文

鲁棒性：鲁棒是Robust的音译，也就是健壮和强壮的意思。它也是在异常和危险情况下系统生存的能力。比如说，计算机软件在输入错误、磁盘故障、网络过载或有意攻击情况下，能否不死机、不崩溃，就是该软件的鲁棒性。所谓“鲁棒性”，也是指控制系统在一定（结构，大小）的参数摄动下，维持其它某些性能的特性。

视觉里程计：当你进入陌生的屋子，你能够知道自己在屋子中的位置，知道周围环境是什么样的。视觉SLAM是机器人利用相机作为眼睛，从而具备与你相同的能力，能够对所在位置进行定位，对周围环境进行建模。视觉SLAM分为前端和后端，视觉里程计是前端，负责从图像中实时捕捉信息。后续还有回环检测和后端优化来使模型更加精确。RGB-D相机，向周围发射结构光根据结构光的变形来确定物体深度。TOF相机，向周围物体发射激光，根据激光反弹时间确定物体深度。（深度即相对于相机的距离）

视觉里程计按照是否使用特征点可以分为直接法和特征点法，直接法使用原始光度

误差最小约束来估计，而特征点法基于特征点匹配进行估计，直接法可以构建更加稠密

的地图，但是特征点法的精度更高且鲁棒性更好，因此多数视觉 SLAM 采用特征点法，

本文也主要聚焦在特征点法的视觉里程计。

特征点法的视觉里程计主要由特征点处理和运动估计两部分组成，其中特征点处理

主要完成的是特征点的提取和匹配，运动估计则是利用特征点匹配关系估计前后帧的相

机运动。

2、机器人视觉伺服跟踪系统的研究硕士学位论文-张作楠-2012

摘要：智能机器人的视觉伺服是利用视觉传感器得到的图像作为反馈信息来构造机器人
的位置闭环控制，即利用视觉传感器来间接检测机器人当前位姿或者其相对于期望目标
图像的当前特征，在此基础上实现机器人的定位控制或者轨迹跟踪。

图像采集卡：图像采集卡（Image Capture Card），又称图像捕捉卡，是一种可以获取数字化视频图像信息，并将其存储和播放出来的硬件设备。很多图像采集卡能在捕捉视频信息的同时获得伴音，使音频部分和视频部分在数字化时同步保存、同步播放。

阈值分割法：是一种基于区域的图像分割技术，原理是把图像像素点分为若干类。图像阈值化分割是一种传统的最常用的图像分割方法，因其实现简单、计算量小、性能较稳定而成为图像分割中最基本和应用最广泛的分割技术。它特别适用于目标和背景占据不同灰度级范围的图像。它不仅可以极大的压缩数据量，而且也大大简化了分析和处理步骤，因此在很多情况下，是进行图像分析、特征提取与模式识别之前的必要的图像预处理过程。图像阈值化的目的是要按照灰度级，对像素集合进行一个划分，得到的每个子集形成一个与现实景物相对应的区域，各个区域内部具有一致的属性，而相邻区域不具有这种一致属性。这样的划分可以通过从灰度级出发选取一个或多个阈值来实现。

雅可比矩阵：