论文准备

关键词

机器人、算法、视觉、深度学习

论文准备

1 图像滤波算法

1.1 算法原理

  • 滤波算法,可以理解成一种过滤算法,就像我们筛选产品时,把次品去除掉,只留下合格的产品。而在图像处理中的滤波算法中,处理的对象是图像,除了去除掉图像中不想要的像素点的值(如去除噪声),还可以加强图像中我们需要研究一些内容(如边缘提取)。
  • 这里所讲的算法都是针对图像空间的滤波算法,其中模板,可以理解为图像形态学中的结构元素,是用来选取图像中的那些像素点被用来操作的。空间滤波根据其功能划分为平滑滤波和锐化滤波。平滑滤波:能减弱或者消除图像中高频率分量,但不影响低频率分量,在实际应用中可用来消除噪声。锐化滤波:与平滑滤波相反,能减弱或者消除图像中低频率分量,但不影响高频率分量,可使图像反差增加,边缘明显。实际应用可用于增强被模糊的细节或者目标的边缘。
     空间增强滤波算法分类
  • 图像滤波可以通过公式:O(i,j)=∑m,nI(i+m,j+n)∗K(m,n);其中K为滤波器,在很多文献中也称之为核(kernel);其中又细分为:均值滤波、中值滤波、高斯滤波、双边滤波
  • 滤波器:
    在这里插入图片描述

1.2 算法特点优势

1.3 算法应用

  • 常见的应用包括去噪、图像增强、检测边缘、检测角点、模板匹配等。

1.4 参考博客

2 基于深度学习的语义分割算法

2.1 算法原理

  • 图像分割是许多视觉理解系统的重要组成部分。它包括将图像(或视频帧)分割成多个片段或对象。分割在医学图像分析(例如,肿瘤边界提取和组织体积测量),自主载体(例如,可导航表面和行人检测),视频监控,和增强现实起到了非常重要的作用。文献中已经开发了许多图像分割算法,从最早的方法,如阈值化、基于直方图的方法、区域划分、k-均值聚类、分水岭,到更先进的算法,如活动轮廓、基于Graph的分割、马尔可夫随机场和稀疏方法。然而,在过去的几年里,深度学习网络已经产生了新一代的图像分割模型,其性能得到了显著的提高——通常在流行的基准上达到了最高的准确率——这导致了许多人认为是该领域的范式转变。
  • 图像分割可以表述为带有语义标签的像素分类问题(语义分割)单个对象分割问题(实例分割)。语义分割对所有图像像素使用一组对象类别(如人、车、树、天空)进行像素级标记,因此通常比预测整个图像的单个标签的图像分类困难。实例分割通过检测和描绘图像中的每个感兴趣对象(例如,个体的分割),进一步扩展了语义分割的范围。
    堆叠多个卷积层
  • 编码器/解码器(encoder/decoder)结构,其中我们先对输入进行下采样(downsample),得到较低分辨率的特征映射,其学习到了如何高效地区分各个类,然后对这些特征进行上采样(upsample)以得到一个全分辨率分割图。在这里插入图片描述
  • 转置卷积、全卷积网络、添加短路连接、高级的U-Net变体、空洞卷积…

2.2 算法特点优势

  • 缺点:在整个网络中维持图像原始维度计算成本很高(可以通过通过池化或跨步卷积(即压缩空间分辨率)周期性地对特征图进行下采样来减轻计算负载)
  • 语义分割面临语义和位置之间的内在矛盾:全局信息解决的是“是什么”问题,而局部信息解决的是“在哪里”的问题……结合细粒度层和粗粒度层使模型能在全局信息下做出局部预测。

2.3 算法应用

自动驾驶、影像诊断

2.4 参考博客

3 边缘检测算法

3.1 算法原理

  • 边缘:指图像在某一局部强度剧烈变化的区域。强度变化一般有两种情况:阶跃变化、屋顶变化。
  • 边缘检测的任务:找到具有阶跃变化或者屋顶变化的像素点的集合。
  • 边缘检测基本原理:既然边缘是灰度变化最剧烈的位置,最直观的想法就是求微分
    对于第一种情况:一阶微分的峰值为边缘点,二阶微分的零点为边缘点。
    对于第二种情况:一阶微分的零点为边缘点,二阶微分的峰值为边缘点。
  • 也可用差分:使差分的方向和边缘的方向相垂直;一般可将边缘分为水平边缘、垂直边缘和对角线边缘;也有不同算子。
  • 边缘提取其实也是一种滤波,不同的算子有不同的提取效果。比较常用的方法有三种,Sobel算子,Laplacian算子,Canny算子。

3.2 算法特点优势

  • Sobel算子检测方法对灰度渐变和噪声较多的图像处理效果较好,但对边缘定位不是很准确,图像的边缘不止一个像素;当对精度要求不是很高时,是一种较为常用的边缘检测方法。
  • Canny方法不容易受噪声干扰,能够检测到真正的弱边缘。优点在于,使用两种不同的阈值分别检测强边缘和弱边缘,并且当弱边缘和强边缘相连时,才将弱边缘包含在输出图像中。
  • Laplacian算子法对噪声比较敏感,所以很少用该算子检测边缘,而是用来判断边缘像素视为与图像的明区还是暗区。拉普拉斯高斯算子是一种二阶导数算子,将在边缘处产生一个陡峭的零交叉, Laplacian算子是各向同性的,能对任何走向的界线和线条进行锐化,无方向性。这是拉普拉斯算子区别于其他算法的最大优点。

3.3 算法应用

3.4 参考博客

数学表示和算子
文字解释更多的算子介绍

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值