显著性检测 视觉注意机制 超像素分割

概述

视觉显著性检测(Visual saliency detection)指通过智能算法模拟人的视觉特点,提取图像中的显著区域(即人类感兴趣的区域)。

视觉注意机制

视觉注意机制(Visual Attention Mechanism,VA),即面对一个场景时,人类自动地对感兴趣区域进行处理而选择性地忽略不感兴趣区域,这些人们感兴趣区域被称之为显著性区域。如图所示,当看到这幅图像时,图中的四个人最能引起人的注意。
在这里插入图片描述

人类视觉注意机制有两种策略:

1)自底而上基于数据驱动的注意机制

利用图像的颜色、亮度、对比度、边缘等特征表示,判断目标区域和它周围像素的差异,进而计算图像区域的显著性。

对比度
Itti

把方向,颜色,亮度等特征进行了融合,通过融合特征的对比度得到了一张灰度图,灰度图中的灰度值代表像素点属于显著区域的概率。

无论是基于局部对比度还是基于全局对比度,基于对比度的方法仍然有缺陷,如显著区域内部会发生衰减

对比度累加算法(Accumulate Contrast, AC)
边缘先验

研究图像中的背景应该具有怎样的性质。如果能清楚的知道背景的性质,就可以得到图像中的背景,近而找到前景。

变换域

有效编码假设,该假设可以有效的消除了输入中的冗余。有效编码假设认为,图像可以被分解为两个部分,一个部分是新颖的,另一个部分是已知的。
受到有效编码假设的启发,认为图像显著区域检测问题中可以把显著区域视为新颖的部分,背景部分可以视为已知的部分。求出图像对数谱和幅度谱并除去幅度谱的冗余分量,利用原图像和冗余谱得到图像显著区域的残差谱。

剩余谱(Spectral Residual, SR)算法和频域变换算法
多先验融合

研究者们希望把尽可能多的显著区域检测的先验加入到显著性检测算法中,认为显著区域检测方法分为基于全局的方法和基于局部的方法。但是这两种方法都存在缺陷。人类视觉系统皮层在观察物体时是先中心后周围的。同时人类对于局部的,对比度比较高的区域比较敏感。提出了一种结合全局与局部特征的显著区域检测方法[

2)自上而下基于任务驱动的目标的注意机制

由人的“认知因素” 决定, 从高层视觉信息入手,比如知识、预期和当前的目标.对图像的特定特征来计算图像区域的显著性。监控任务下, 场景中的人体能引起注意。

类型

近年来研究者们在特征综合理论和Guided search等注意的心理学模型基础上, 提出了大量的可计算的注意力选择模型,以用于模拟人类的视觉注意机制。这些模型包括: 基于认知、贝叶斯、决策论、信息论、图模型、频域分析、基于模式分类、基于CNN的等人视觉注意模型。

  1. 认知模型

几乎所有模型都直接或间接地受认知模型启发而来,其一大特点是与心理学和神经学相结合。Itti模型(使用三个特征通道:颜色、属性、方向)是这一类模型的代表,也是后来很多衍生模型的基础

  1. 信息论模型

本质是最大化来自所处视觉环境的信息,其中最有影响力的模型是AIM模型。

  1. 图论模型
    图模型是一个使用图对随机变量之间的条件依赖结构进行表示的概率框架。这种类型的注意模型,把眼动看作一个时间序列。由于有大量的隐变量影响眼球运动的产生,因此,该类注意模型使用了隐马尔科夫模型、动态贝叶斯网和条件随机场等方法。图模型可以对复杂的注意机制建模,因此能取得较好的预测能力,缺点在于模型的高复杂度,尤其涉及训练和可读性时。

典型模型有:基于图论的视觉显著性(Graph-based Visual Saliency , GBVS)模型

  • 首先,对输入图像提取多个通道的特征图;
    利用n 种不同的线性和非线性滤波器 得到不同通道的特征图M在这里插入图片描述
  • 然后,分别针对每个特征通道图计算对应的响应图;
    为了计算特征图M 对应响应图A ,首先要将M 中像素点视为节点,构造有向全连接图G
    G 中从点 p 到点q 的有向边的权重
    在这里插入图片描述
    d是点 p 和点q 的特征差异性

在G 上定义一个马尔科夫链,当一个节点与其邻域节点特征差异性较大时,那么将在这个节点上停留更长时间,基于停留时间可以计算出A中每个节点的响应值。

  • 最后,将多个响应图A进行融合得到需要的显著图。
  1. 频域模型

基于频谱分析的显著性模型,形式简洁,易于解释和实现,并且在注意焦点预测和显著区域检测方面取得了很大的成功,但其生物合理性不是非常清楚。经典模型有:频谱残差的显著性检测模型(纯数学计算方法)。

https://www.cnblogs.com/ariel-dreamland/p/8919541.html

https://blog.csdn.net/tyq101010/article/details/48626995

显著性检测预处理

超像素分割

超分割是指根据一定的规则把图像分成若干个小块。后续的算法通常会对超像素而不是像素点进行操作。

图像边缘检测算法

简单线性迭代聚类(Simple Linear Iterative Clustering,SLIC)

https://blog.csdn.net/zhj_matlab/article/details/52986700

评价指标

(1) 精确召回(PR)。首先将显著图S转化为二进制掩码M,然后通过将M与地面真值G进行比较来计算Precission和Recall:
(2) F值:通常Precission和Recall都不能完全评估显著图的质量,为此提出F值作为Precission和Recall的非负权重的集权跳河平均:
(3) ROC(Receiver Operating Characteristic)曲线:是以假正率(FP_rate)和假负率(TP_rate)为轴的曲线
(4)ROC曲线下面积(AUC):AUC越大性能越好

(5) 平均绝对误差(MAE):进行更全面的比较。
在这里插入图片描述

具体算法

https://blog.csdn.net/l1l2l3q1q2q3/article/details/70056132?utm_medium=distribute.pc_relevant.none-task-blog-baidujs-2
https://blog.csdn.net/cai13160674275/article/details/72991049?utm_medium=distribute.pc_relevant.none-task-blog-baidujs-2
https://blog.csdn.net/tyq101010/article/details/48626955?utm_medium=distribute.pc_relevant.none-task-blog-baidujs-1
https://www.cnblogs.com/CCBB/archive/2011/05/19/2051442.html

https://blog.csdn.net/gbyy42299/article/details/79427457

https://mmcheng.net/bing/
BING: Binarized Normed Gradients for Objectness Estimation at 300fps

  • 2
    点赞
  • 19
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
智慧校园整体解决方案是响应国家教育信息化政策,结合教育改革和技术创新的产物。该方案以物联网、大数据、人工智能和移动互联技术为基础,旨在打造一个安全、高效、互动且环保的教育环境。方案强调从数字化校园向智慧校园的转变,通过自动数据采集、智能分析和按需服务,实现校园业务的智能化管理。 方案的总体设计原则包括应用至上、分层设计和互联互通,确保系统能够满足不同用户角色的需求,并实现数据和资源的整合与共享。框架设计涵盖了校园安全、管理、教学、环境等多个方面,构建了一个全面的校园应用生态系统。这包括智慧安全系统、校园身份识别、智能排课及选课系统、智慧学习系统、精品录播教室方案等,以支持个性化学习和教学评估。 建设内容突出了智慧安全和智慧管理的重要性。智慧安全管理通过分布式录播系统和紧急预案一键启动功能,增强校园安全预警和事件响应能力。智慧管理系统则利用物联网技术,实现人员和设备的智能管理,提高校园运营效率。 智慧教学部分,方案提供了智慧学习系统和精品录播教室方案,支持专业级学习硬件和智能化网络管理,促进个性化学习和教学资源的高效利用。同时,教学质量评估中心和资源应用平台的建设,旨在提升教学评估的科学性和教育资源的共享性。 智慧环境建设则侧重于基于物联网的设备管理,通过智慧教室管理系统实现教室环境的智能控制和能效管理,打造绿色、节能的校园环境。电子班牌和校园信息发布系统的建设,将作为智慧校园的核心和入口,提供教务、一卡通、图书馆等系统的集成信息。 总体而言,智慧校园整体解决方案通过集成先进技术,不仅提升了校园的信息化水平,而且优化了教学和管理流程,为学生、教师和家长提供了更加便捷、个性化的教育体验。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值