论文阅读笔记
文章平均质量分 81
论文阅读
流觞时光
此行山高路远,所幸我口袋还有玫瑰一片
展开
-
场景图生成论文阅读笔记 之 Visual Relation Detection with Multi-Level Atention
Visual Relation Detection with Multi-Level Atention2019 ACM MMVisual Relation Detection with Multi-Level Atention2019 ACM MM针对问题大多数工作直接使用Union Box区域作为谓词的视觉特征,这样会1)引入无关的背景信息。2)忽视了目标周围的上下文信息因为视觉特征、位置信息、语义信息(类别)都对关系的预测有贡献,大多数工作直接将三个线索直接拼接在一起,但是不同场景下不同线原创 2021-11-02 15:52:45 · 274 阅读 · 0 评论 -
场景图生成论文阅读笔记 之 Attention-Translation-Relation Network for Scalable Scene Graph Generation
Attention-Translation-Relation Network for Scalable Scene Graph Generation2019 ICCVcode: https://github.com/deeplab-ai/atr-net我是目录Attention-Translation-Relation Network for Scalable Scene Graph Generation针对问题算法内容具体结构损失函数总结针对问题很多工作使用通用的注意机制和数据集的统计特性来取代原创 2021-10-10 17:01:26 · 303 阅读 · 0 评论 -
场景图生成论文阅读笔记 之 AVR:Attention based Salient Visual Relationship Detection
AVR:Attention based Salient Visual Relationship DetectionarXiv2020我是目录????针对问题算法思想算法内容Predicate Prediction ModuleAttention Module利用数据集先验知识部分针对问题以前的工作都对一幅图像中所有可见的关系都一视同仁,而一些不重要的关系会对结果在一定程度上造成影响,因此需要筛选出更显著(salient)的关系对。算法思想结合视觉特征、语义信息(类别标签)、空间信息(位置)预测关原创 2021-09-28 16:47:12 · 436 阅读 · 1 评论 -
场景图生成论文阅读笔记 之 PCPL
PCPL(predicate-correlation perception learning scheme)阅读笔记(谓词联系感知学习策略)目录针对问题论文流程实验结果针对问题VG数据集长久以来的难题:谓词类的长尾效应过于严重导致结果很容易预测为头部类,并且谓词类之间并不是相互独立的,在很多场景下会是包含等等的关系,因此可以利用谓词与谓词之间的关联信息。作者提到:当前比较普遍的重调节策略(re-banlance strategy, 例如重采样,调节权重等) 会导致模型在尾部数据过拟合。作者认为这是原创 2021-09-23 17:15:10 · 658 阅读 · 0 评论 -
场景图生成论文阅读笔记 之 CogTree: Cognition Tree Loss for Unbiased Scene Graph Generation
2020 arXiv《CogTree: Cognition Tree Loss for Unbiased Scene Graph Generation》无偏场景图生成的认知树损失文章目录《CogTree: Cognition Tree Loss for Unbiased Scene Graph Generation》针对问题/基本思想算法步骤① Bias-based ‘Concept’② 构建Concept-centered子树③ 组合子树Cognition Tree Loss实验结果针对问题/基原创 2021-07-25 16:36:34 · 791 阅读 · 0 评论 -
场景图生成论文阅读笔记 之 Unbiased Scene Graph Generation from Biased Training
2020 CVPR oral《Unbiased Scene Graph Generation from Biased Training》作者博文:https://mp.weixin.qq.com/s/wLsVyyhP9jjBoj1FMgy3xg文章目录《Unbiased Scene Graph Generation from Biased Training》针对问题本文创新SGG算法结构实验结果实验细节针对问题由于VG数据的长尾效应,大部分SGG方法中网络更关注label信息,而没有很好的利用视觉原创 2021-07-22 16:58:17 · 850 阅读 · 5 评论 -
场景图生成论文阅读笔记 之 Graph R-CNN for Scene Graph Generation
2018 ECCV《Graph R-CNN for Scene Graph Generation》比较早使用图网络进行场景图生成的论文,对后续工作具有一定的启发性,在这做一记录文章目录《Graph R-CNN for Scene Graph Generation》针对问题文章创新点模型结构① Object Proposal② Relation Proposal Network③ Attentional GCN实验结果针对问题很多工作中预测关系时都是密集关系的方式(目标与其它每个目标之间都存在关系)原创 2021-07-19 16:49:13 · 1267 阅读 · 0 评论 -
场景图生成论文阅读笔记 之 PANet:A Context Based Predicate Association Network for Scene Graph Generation
2019 ICME《PANet: A Context Based Predicate Association Network for Scene Graph Generation》文章目录《PANet: A Context Based Predicate Association Network for Scene Graph Generation》针对问题本文创新网络结构谓词预测(关系预测)实验结果针对问题以前的工作(IMP、MotifNet等等)利用了上下文信息,空间位置信息(LinkNet等),原创 2021-07-14 20:53:46 · 357 阅读 · 0 评论 -
场景图生成论文阅读笔记 之 LinkNet: Relational Embedding for Scene Graph
NIPS 2018《LinkNet: Relational Embedding for Scene Graph》文章贡献:提出了基于CNN的LinkNet结构,在结构中引入了卷积自注意力机制,最终结果超越MotifsNet达到了当时的SOTA本文创新:① 引入了自注意力机制② 目标在作为主语和宾语时的特征是不同的(即提取目标特征过程中是受其它目标影响的)③ 和Motifs Net相似,分为多阶段进行,并利用了目标的类别标签信息④ 结合了目标的空间位置信息注:后两点严格来说不算是本文的创新原创 2021-07-13 16:38:02 · 472 阅读 · 0 评论 -
场景图生成论文阅读笔记 之 Detecting Visual Relationships with Deep Relational Networks
CVPR 2017《Detecting Visual Relationships with Deep Relational Networks》属于基于CNN实现的,并非后续主流的RNN、LSTM、图神经网络的方法,并且比较早,因此不作过详细记录,仅重点记录下创新点文章目录《Detecting Visual Relationships with Deep Relational Networks》针对问题本文创新点网络结构空间位置信息提取针对问题Local prediction,前人工作没有考虑到上下原创 2021-07-11 15:50:27 · 126 阅读 · 0 评论 -
场景图生成论文阅读笔记 之 Neural Motifs
CVPR2018《Neural Motifs: Scene Graph Parsing with Global Context》文章目录《Neural Motifs: Scene Graph Parsing with Global Context》针对问题问题分析Motifs概念文章创新网络模型实验结果针对问题① 很多前人的工作是local prediction,未利用上下文信息(这一点与IMP针对的问题相同)② 作者分析了VG数据集,发现具有很大的长尾效应(关系检测数据集的通病),并且很多关系类原创 2021-07-09 16:52:47 · 1921 阅读 · 5 评论 -
场景图生成论文阅读笔记 之 IMP(Scene Graph Generation by Iterative Message Passing)
IMP 2017CVPR《Scene Graph Generation by Iterative Message Passing》针对问题前人的工作大多是local prediction,未利用丰富的上下文信息,因此会造成关系类别预测出现模糊和歧义图的表示把node(目标)和各个node之间的edge(边)都视为节点,即node节点和edge节点,因为edge也需要具备状态和更新状态,所以把edge也视为节点。因此每个node节点直接相连的只有edge节点,反之同理,与edge节点直接相连的的只原创 2021-07-08 21:35:21 · 569 阅读 · 1 评论 -
论文阅读笔记 之 GS3D
论文:GS3D An Efficient 3D Object Detection Framework for Autonomous DrivingGS3D 目录解决问题文章主要贡献问题定义总体流程具体内容一、2D边框检测与方向预测(2D+O subnet)二、Guidance生成2.1 Guidance尺寸估计2.2 Guidance 坐标估计2.3 Guidance 角度估计三、表面特征抽取四、Refine4.1 refine4.2 Quality Aware Loss五、实验结果解决问题① 经典的原创 2021-03-31 15:15:57 · 615 阅读 · 0 评论 -
论文阅读笔记 之 3D Bounding Box Estimation Using Deep Learning and Geometry
目录一、 解决的主要问题二、 预备知识三、 论文内容:四、 CNN估计3D box参数:4.1 偏航角回归4.2 网络结构4.3 损失函数4.3.1 回归角度部分的损失函数4.3.2 尺寸回归部分的损失函数五、 实验5.1 数据增强5.2 结果展示发表时间及期刊/会议 : 2017 CVPR论文地址:https://arxiv.org/abs/1612.00496一、 解决的主要问题单目图像实现3D目标检测已有条件/输入: 相机的内参矩阵K, 单目相机图像需要求的结果:3D bounding b原创 2021-03-12 13:07:10 · 2370 阅读 · 4 评论 -
论文阅读笔记 之 YOLOv4 & scaled YOLOv4
一、目标检测框架总结在YOLOv4论文中,作者首先对当前目标检测领域的模型进行了总结。作者将目标检测模型归纳为下图所示的结构:作者将模型分为 输入、backbone、neck、预测部分,其中Dense Prediction加前三部分为one-stage检测模型框架,Sparse Predition 加前三部分为two-stage 检测模型框架。这里的Neck部分主要指的是网络中对backbone提取的特征进行多尺度融合(如FPN等)或者进一步处理(注意力机制等)。并且作者也列出来各个部分目前表现较好的原创 2020-11-30 21:38:30 · 2768 阅读 · 0 评论 -
论文阅读笔记 之 Fast R-CNN
Fast R-CNN提出问题本文贡献网络结构算法流程训练batch组成选择损失函数其它改进检测结果总结主要缺点模型评估参考文献及资料论文主要基础(前作)(先看完这两篇后再食用fast-RCNN更加):R-CNN,SPP-Net提出问题R-CNN与SPP-Net有以下缺点:① 多阶段训练。需要分别训练特征提取网络、SVM分类器、边框回归部分,训练不连续,耗费时间② 对于SVM和边框回归的训练,需要从每个建议区域提取特征并存储到磁盘中,需要占据大量的存储空间③ SPP-Net的训练中,空间金字塔池原创 2020-10-15 10:49:48 · 347 阅读 · 0 评论 -
论文阅读笔记 之 SPP-Net
Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition视觉识别空间金字塔池化深度卷积网络本文解决的问题解决方法问题①问题②训练策略实验结果视觉识别空间金字塔池化深度卷积网络本文解决的问题① 已有的卷积神经网络的输入都要求大小固定(例如R-CNN等),因此需要对输入进行强行裁剪或者放缩,这会导致目标信息的损失以及额外的图像预处理时间。原因:因为卷积神经层后都添加了全连接层,而全连接层的神经元数量是固定原创 2020-09-26 16:25:02 · 183 阅读 · 0 评论 -
论文阅读笔记 之 R-CNN
R-CNN前文文章解决的问题:解决方法:问题①:1、 region proposals:2、 特征提取3、分类检测问题②:总体训练流程:测试流程:缺点:参考文献:前文R-CNN是2014年的老文章了,无论作为CNN应用于目标检测中的首篇文章,或是作为Fast R-CNN等等后续文章的基础,都有读的必要性,因此这里对R-CNN的主要流程进行了分析与总结,没有过于深入地分析其特点与细节问题。如有错误之处,还请指正文章解决的问题:① 如何将CNN应用在目标检测里(模型设计问题)② 训练样本数不足时,如何原创 2020-09-20 16:11:51 · 157 阅读 · 0 评论