(2021 cnki) 基于深度神经网络的显著性检测方法研究 (B类)

一、作者

​ 黄汉秦 (江西财经大学)

二、原文地址

(2021 cnki)

三、主要内容

3.1 主要工作

  • 本文提出基于语义信息的自闭症患者视觉显著区域检测算法,此外本算法设计了一种正负样本均衡的损失函数,以达到更好的训练效果。
  • 本文提出了基于多标签监督学习的显著目标检测算法。本文共设计三个子模块,它们分别是显著目标监督模块边缘信息监督模块目标定位监督模块,以及一个PDM模块以此检测出更精准的结果。最后为了进一步提高模型的性能,将输出的显著图和特征图一同输入到细化网络中进行优化,得到最终稳定的显著图。

3.2 显著性区域检测算法

3.2.1 网络结构 (U-net)

image-20211216193104677

3.2.2 数据增强方式

  • 平移、旋转、镜像、裁剪、尺度变换、亮度增强、色度增强、对比度增强和锐度增强

3.2.3 正负样本均衡 Loss

L o s s k + = 1 2 M + ∑ ( i , j ) ϵ C k − ( y i , j k − g ( i , j ) k ) 2 L o s s k − = 1 2 M − ∑ ( i , j ) ϵ C k − ( y i , j k − g ( i , j ) k ) 2 L o s s = 1 N ∑ k = 1 N ( L o s s k + + L o s s k − ) Loss_k^+ = \frac{1}{2M^+} \sum_{(i,j)\epsilon C_k^-}(y_{i, j}^k-g_{(i, j)}^k)^2 \\ Loss_k^- = \frac{1}{2M^-} \sum_{(i,j)\epsilon C_k^-}(y_{i, j}^k-g_{(i, j)}^k)^2 \\ Loss = \frac{1}{N} \sum_{k=1}^{N}(Loss_k^+ + Loss_k^-) Lossk+=2M+1(i,j)ϵCk(yi,jkg(i,j)k)2Lossk=2M1(i,j)ϵCk(yi,jkg(i,j)k)2Loss=N1k=1N(Lossk++Lossk)

M + M^+ M+ :正样本的像素点数量 M − M^- M :负样本的像素点数量 C k + , C k − C_k^+ , C_k^- Ck+,Ck :正样本和负样本坐标集合

3.2.4 评价指标

  • ROC曲线下的面积(Area Under the ROC Curve, AUC)
  • 皮尔逊线性相关系数(Pearson Linear Correlation Coefficient, CC) C C ( p , g ) = c o v ( p , g ) σ p σ g CC(p, g)= \frac{cov(p, g)}{\sigma_p \sigma_g} CC(p,g)=σpσgcov(p,g)
  • 受试者工作路径(Normalized Scanpath Saliency, NSS)
  • KL散度(KullbackLeibler Divergence, KL)

3.2.5 结果 (第三列)

HHQNet1_result

3.3 显著性目标检测算法

3.3.1 网络结构图 (ResNet-50) (目标、边缘、定位)

HHQNet2

3.3.2 PDM模块 (空洞卷积)

HHQNet_PDM

3.3.3 多标签生成

  • 采用一阶 Sobel 算子提取的边缘
  • 边缘膨胀

HHQNet2_2

3.3.4 显著定位图 (COV算法预测的fixation)

HHQNet2_3

3.3.5 Loss

  • BCE
  • Dice (显著图与标签图的两倍交集比上它们的像素和)

L d i c e = 1 − 2 ∑ ∣ ∣ G ⋂ P ∑ ∣ G ∣ + ∑ ∣ P ∣ L o s s = L b c e + L d i c e L_{dice}=1-\frac{2\sum||G \bigcap P}{\sum|G| + \sum |P|} \\ Loss = L_{bce} + L_{dice} Ldice=1G+P2GPLoss=Lbce+Ldice

3.3.6 评估指标

  • MAE
  • F-measure

3.3.7 结果 (最后一列)

HHQNet2_result

四、研究内容展望

  • 针对有监督的显著性检测算法,需要进一步优化模型,让学习到的模型尽可能落地使用,为解决生活问题提供帮助。一方面研究学者可以简化模型,提高算法检测精度的同时,缩短推理速度,让算法融合到应用程序中,方便各用户使用;另一方面可以探索日常生活场景下的显著性检测,让学术走出实验室,实验室大多是理想状态下的场景,具有分明的显著目标,算法往往很容易检测出来,然而这些场景下数据很难贴近生活,即使实验室下性能很好的模型,放到生活场景下很容易检测出错。
  • 基于深度学习的无监督检测算法将是一个很好的研究切入点,可以彻底摆脱对标注数据的依赖,在降低成本的同时可以更好的提高模型鲁棒性。

好的提高模型鲁棒性。

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值