MatConvNet卷积神经网络(三)【图像滑动窗】

使用MatConvNet的神经网络模型结合滑动窗技术,对图像进行内容搜索。针对不同大小的目标,采用多个尺寸的窗口按步长移动,对框内图像进行分类。当分类结果为预设类别且置信度高时,标记窗口位置。文章提供了一个MATLAB实现的滑动窗函数示例。
摘要由CSDN通过智能技术生成

利用滑动窗搜索图像中的特定内容

Matconvnet官方给出的神经网络分类器imagenet-googleNet-dag.mat已经具备了较强的识别能力,能识别1000种标签。利用它再编写一个滑动窗函数,即可实现对大图像的内容搜索(如在一棵果树上寻找果子)。


分析:

由于图像中目标对象的大小往往不同,所以采用多个不同尺寸的滑动窗口对图像进行处理。处理时,窗口由左向右,由上向下依照一定的步长逐次移动,每次移动,将框内的图像输入神经网络进行处理,然后通过得到的结果做出相应。

在本例中,若分类得到的标签号大于900(考虑到干扰,只需分类结果满足为水果),且置信度大于0.90,则记录该窗口的位置,在原图上用黑框将这个位置标出。


首先先来编写窗口尺寸不变的滑动窗函数:(MATLA

  • 2
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 11
    评论
评论 11
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值