![](https://img-blog.csdnimg.cn/20201014180756916.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
论文阅读
文章平均质量分 90
Cheungleilei
一个仙女
展开
-
【论文阅读】ICNet: Intra-saliency Correlation Network for Co-Saliency Detection
本文发表在NeurIPS 2020上,内容是关于Co-SOD,主要讲了如何充分利用intra-saliency和inter-saliency,每一步都解释得很到位,是一篇很值得阅读的论文。一些名词解释Co-salient Object Detection (Co-SOD): Detect the common salient objects among a group of input images.Intra-saliency: salient object detection of a sin.原创 2022-03-22 20:00:57 · 669 阅读 · 0 评论 -
【论文阅读】Visual Sentiment Prediction Based on Automatic Discovery of Affective Regions
概括本文尝试去解决在情感分析中所遇到的情感分类和可解释性问题。这里的可解释性主要指图片上哪一区域会影响人类视觉对情感的判断。本文解决这个问题的办法是引入了Affective Region (AR),类似空间注意力的东西。结合流程图,整体的思路和亮点有两个:弱监督找到AR(建立自动寻找AR的模型),用于定位最容易影响人类视觉判断情感的区域,起到辅助情感分类的作用。【也就是下面的红色虚线框部分】建立情感分类器(采用了求和池化、最大池化、级联三个策略)【红色虚线框以外的部分】产生候选AR首先看.原创 2022-02-23 15:41:32 · 519 阅读 · 0 评论 -
【论文阅读】GhostNet: More Features from Cheap Operations(GhostNet学习笔记)
华为诺亚方舟实验室提出新型端侧神经网络架构GhostNet。论文地址:https://arxiv.org/pdf/1911.11907.pdf从论文的摘要可以对GhostNet有个大概的了解:Deploying convolutional neural networks (CNNs) on embedded devices is difficult due to the limited m...原创 2020-03-23 11:33:09 · 1208 阅读 · 0 评论 -
对视觉显著性检测(Saliency Object Detection)中Channel Attention的一些总结
因为最近的paper涉及,所以对channel attention进行了了解,比较浅显,但是以此篇博客记录,之后有相关进展,也会更新。已经有很多相关的文章对Attention的本质,原理进行介绍。例如:Attention综述:基础原理、变种和最近研究我挑一些我学习过程中觉得重要的点。首先,Attention的本质是一个查询(query)到一系列(键key-值value)对的映射,也就是一个寻...原创 2020-03-05 10:50:29 · 4317 阅读 · 0 评论 -
【论文阅读】Emotion-Aware Human Attention Prediction
Cordel M O, Fan S, Shen Z, et al. Emotion-Aware Human Attention Prediction[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2019: 4026-4035.摘要:尽管最近在人脸识别和物体分类方面取得了成功...原创 2020-01-07 19:17:25 · 861 阅读 · 0 评论 -
【论文阅读】Three-stream attention-aware network for RGB-D salient object detection
Chen H, Li Y. Three-stream attention-aware network for RGB-D salient object detection[J]. IEEE Transactions on Image Processing, 2019, 28(6): 2825-2835.摘要:以前的基于卷积神经网络的RGB-D融合系统通常采用两流体系结构,其中RGB和深度输入是...原创 2020-01-07 19:15:36 · 1403 阅读 · 1 评论 -
【论文阅读】A Simple Pooling-Based Design for Real-Time Salient Object Detection
摘要:本文通过扩展卷积神经网络中的池化部分来解决显著目标检测问题。基于特征金字塔,在自底向上路径上加入GGM模块(Global Guidance Module),目的是为不同特征层提供潜在显著对象的位置信息。在自顶向下路径上加入FAM模块(Feature Aggregation Module),目的是将粗糙语义信息和细致特征更好融合。在FPNs的融合操作后的自顶向下路径中加入FAMs,能够多尺度...原创 2019-12-24 11:09:31 · 930 阅读 · 0 评论 -
【行为识别】论文阅读笔记1|Two-Stream Convolutional Networks for Action Recognition in Videos
参考山水之间2018的文章,行为识别(Action Recognition) 的目的是对一个给定的视频片段进行分类。行为检测(Action Detection) 的目的是知道一个动作在视频中是否发生,以及动作发生在视频中的开始时间和结束时间。行为识别和行为检测的关系类似于图片分类和目标检测的关系。目前行为识别有两个主流的结构,一个是Two-Stream,一个是C3D,本文阅读了Two-St...原创 2019-10-28 16:32:04 · 2397 阅读 · 0 评论 -
【行为识别】论文阅读笔记2|C3D:使用3D卷积网络学习时空特征
Learning Spatiotemporal Features with 3D Convolutional Networks摘要提出了一个简单但有效的学习时空特征的方法,利用在大规模监督视频数据集上训练得到的深度三维卷积网络(3D ConvNets)学习。贡献主要有三个方面:对比2D卷积网络,3D卷积网络更适合学习时空特征。对3D卷积网络来说,在所有层都用3×3×3的小卷积效果最好...原创 2019-11-19 10:33:28 · 2969 阅读 · 1 评论 -
【论文阅读】Spatial Temporal Graph Convolutional Networks for Skeleton-Based Action Recognition
摘要动态人类骨架能够为人体行为识别传递大量的信息。传统的对人体骨架建模的方法是依赖于手工涉及或者遍历规则的,导致的结果就是表达力不强且泛化困难。在这里提出一种创新的动态骨架建模方法ST-GCN,能自动从数据中学习空间和时间特征。引言人体的行为可以由集中形式被识别:外观、光流和骨架。其中骨架蕴含大量信息,所以本文系统地研究了这种形式,将骨架运用到行为识别方向。动态的骨架能够自然地由2D或者...原创 2019-12-07 15:37:02 · 2397 阅读 · 0 评论