1. Visual Saliency Based on Multiscale Deep Features 原文链接:https://arxiv.org/pdf/1503.08663.pdf 翻译:https://blog.csdn.net/weixin_40740160/article/details/89005994 题目:基于多尺度深度特征的视觉显著性 作者:Guanbin Li,Yizhou Yu 发表:2015年4月,arxiv 方法概要: 1. 先对图像进行超像素分割 2. 多尺度特征提取,共分为三个尺度,超像素、超像素邻域、全局,超像素与超像素邻域均填充成矩形区域 3. 将三个尺度的矩形区域分别放入一个五层的卷积网络,得到三个尺度的特征向量 4. 将三个尺度的特征向量顺序拼接传入两层的全连接网络,计算得到当前超像素块的显著性值 5. 按照多个不同的等级进行多次分割,然后可以得到多个尺度的显著图,文章中用了15个不同的等级分割 6. 最后显著图中每个像素的显著值是多个等级的显著值的均值 6. 后处理。为了增强空间连续性,做了一定的平滑处理,也是使用最小代价函数的方式进行训练得出 网络结构: 已知问题 1. 耗时,对一张400x300的图像进行显著性检测需要8s 2. 复杂,需要对图片进行多个尺度的分割 3. 没有足够充分的保留全局特征,自身的特征向量是完全脱离全局特征得到的 CVPR2015 1. Saliency Detection by Multi-Context Deep Learning 原文链接:openaccess 翻译:https://blog.csdn.net/qq_26569761/article/details/49053573 题目:基于多上下文深度学习的显著性检测方法 作者:Rui Zhao,等 发表:CVPR2015 方法概要: 1. 上下文取全局上下文和局部上下文,先使用SLIC超像素分割 2. 全局上下文以一个超像素为中心,包含整张图片,然后进行扩展,再降采样成227×227×3的图片 3. 局部上下文同样以该超像素为中心选全局上下文的三分之一大小,放缩成227×227×3 4. 分别放入五层卷积网络中进行计算中心超像素的显著性,最后将不同尺度上下文中的显著性进行融合 网络结构 已知问题 1. 重复处理,每次要对较大的图片区域处理,但是最终得到的只是中心超像素的显著性 2. Deep networks for saliency detection via Local Estimation and Global Search 原文链接: