ML
WangKingJ
目前是咸鱼一条,但是也是一只有梦想的咸鱼~
展开
-
Graph-propagation based Correlation Learning for Weakly Supervised Fine-grained Image Classification
文章提出了一个GCL模型,它主要的创新在于两个部分,其一是criss-cross graph propagation (CGP),其二是correlation feature strengthening (CFS) ,CGP的目的是用来在区域的discriminative ability学习中,同时考虑全局图像级上下文和局部空间上下文。CFS的目的是用来探索区域特征向量之间的内部语义相关性,以获得...原创 2020-04-18 21:30:11 · 1865 阅读 · 7 评论 -
Fine-grained Recognition: Accounting for Subtle Differences between Similar Classes
符号定义:III是训练的图像,其对应的ground-truth labell∈JJ=1,2,...,Cl\in J J={1,2,...,C}l∈JJ=1,2,...,C是包含所有标签的标签集,M∈RC×H×WM\in R^{C\times H\times W}M∈RC×H×W是Diversification Block的输入,是特定的类别的activation map,M=Mc:c∈[1,C]...原创 2020-04-10 20:17:22 · 1074 阅读 · 0 评论 -
Attention Convolutional Binary Neural Tree for Fine-Grained Visual Categorization
来自于CVPR2020的一篇文章,原文链接:https://arxiv.org/abs/1909.11378代码发布地址: https://isrc.iscas.ac.cn/gitlab/research/acnet.(应该是暂时还没有发布)论文提出了使用注意力卷积的二叉神经树进行细粒度分类,在树结构的边上进行注意力卷积操作,每个节点使用路由函数来定义从根节点到叶子结点的计算路径,结合所有叶...原创 2020-04-05 16:51:43 · 2459 阅读 · 12 评论 -
Looking for the Devil in the Details
本文是2019年CVPR的一篇文章,作者团队来自于中国科技大学论文链接:https://arxiv.org/abs/1903.06150v1Devil是一个很有意思的名字,让我想起了boss提到的他们家的小公主~contributions提出了一种新颖的三线性注意力采样网络【trilinear attention sampling network】(TASN),以从数百个用于细粒度图像识...原创 2020-03-27 15:21:33 · 691 阅读 · 0 评论 -
Destruction and Construction Learning for Fine-grained Image Recognition论文解读
2019年CVPR的一篇关于细粒度识别的文章,我觉得论文的名字就很有吸引力,Destruction and Construction Learning(DCL)。贡献提出了一种新颖的“Destruction and Construction Learning(DCL)”框架,以进行细粒度的识别。对于Destruction,region confusion mechanism(RCM)迫使分类...原创 2020-03-22 20:04:33 · 906 阅读 · 1 评论 -
Weakly Supervised Complementary Parts Models for Fine-Grained Image Classification
3.2 Weakly Supervised Object Detection and Instance SegmentationCoarse Object Mask Initialization. 给定一个图像III和它的标签ccc,分类网络的最后的卷积层的特征图被标记为ϕ(I,θ)∈RK×h×w\phi(I,\theta)\in \R^{K\times h\times w}ϕ(I,θ)∈RK...原创 2020-03-08 21:40:43 · 2227 阅读 · 0 评论 -
Multi-Attention Multi-Class Constraint for Fine-grained Image Recognition论文解读
简介这篇论文是2018 ECCV的一篇论文,提出了一种半监督的细粒度图像识别的网络。细粒度图像识别(Fine-Grained Image Recognition)对于细粒度图像识别,简单的解释就是对于同一个大的类别中,不同子类之间的识别。以狗来进行举例就是,狗是大类,它包含很多的品种,每个品种就可以看做是一个子类。由于受到多种干扰因素的影响,包括物体姿态、视角、光照、遮挡等,通常会使子类之...原创 2020-03-05 22:02:44 · 868 阅读 · 0 评论 -
CurriculumNet解读
解决的问题一句比较有意思的调侃是,人工智能是先人工后智能,即先有大量的人工的数据标注,然后才能以此训练一个高效的网络。码隆科技2018 ECCV的这篇论文提出了一种训练方法,能够在数据没有或者只有少量人工标注和清洗的情况下,仍然能利用这些噪声数据训练出一个高性能的深度学习模型。方法Overview整个网络的Pipeline包含三个部分:initial features genera...原创 2020-02-29 19:24:33 · 492 阅读 · 0 评论 -
Label-PEnet解读
这篇论文是码隆科技发表在ICCV 2019的论文,这一研究致力于在仅仅给定图像级别标签的情况下精确地检测与分割物体实例。因为手工标注大量训练数据代价高昂,与监督学习、半监督学习等方式相比,它是更适用于现实应用的技术。与以前那些包含多个离线模块的方法不同的是,本篇论文提出了序列化标签传播与增强网络(缩写为 Label-PEnet)。Label-PEnet 基于一种由粗到细的方式,可以递进地将图像级别...原创 2020-02-23 21:23:18 · 1315 阅读 · 0 评论 -
Sequential Label Propagation and Enhancement Networks for Weakly Supervised Instance Segmentation
Abstract弱监督实例分割的目的是在只给出图像级标签的情况下,精确地分割对象实例。不像以前的方法是由多个离线阶段组成,我们提出了顺序标签传播和增强网络(称为标签- penet),它以一种由粗到精的方式逐步地将图像级标签转换为像素级标签: 设计了多标签分类、目标检测、实例细化和实例分割四个级联模块,通过共享主干实现。通过课程学习策略交替地训练级联管道,该策略生成从高级别图像到低级别像素的标记...原创 2020-02-16 22:55:24 · 597 阅读 · 0 评论 -
Spectral Networks and Deep Locally Connected Networks on Graphs翻译
Aabstract 卷积神经网络在图像和音频识别任务中是非常有效的架构,因为它能够利用信号类在其域中的局部平移不变性。在本文中,我们考虑在没有平移作用的情况下,CNNs可以推广到一般 域上定义的信号. 特别地,我们提出了两种结构,一种基于域的层次聚类,另一种基于图拉普拉斯谱。我们通过实验证明,对于低维图,学习卷积层是可能的,它有许多与输入大小无关的参数,从而得到高效的深度架构。1 Intro...原创 2020-02-12 16:19:21 · 828 阅读 · 0 评论 -
6D-VNet:End-to-End 6DoF Vehicle Pose Estimation from Monocular RGB Images解读
首先是指专注于自动驾驶领域,在这项任务中,交通参与者沿纵轴的平移距离变化比较大,因此,平移的估计是更具有挑战性的。同时,车辆的平移估计比方向估计更为关键。传统的方法是将平移估计作为一个独立的过程,而不是使用几何投影法进行目标类的预测和旋转估计。但是,几何投影法方法是有假设的前提条件的。1、三维物体的中心投影到二维图像的物体的bounding box的中心2、正确估计预测的对象类别和旋转向量...原创 2019-12-29 22:10:49 · 745 阅读 · 0 评论 -
6D-VNet:End-to-End 6DoF Vehicle Pose Estimation from Monocular RGB Images
Abstract 我们提出了一个概念上简单的6DoF姿态估计网络,尤其是对于自动驾驶场景。在一个单目RGB图像上,我们的方法能够有效的检测交通工具,同时回归它们的三维平移和旋转向量。这个方法叫做6D-VNet,在Mask R-CNN上扩展了一个定制的投网络,以用于检测更好的车辆类比,旋转和平移。与以往的方法相比,本文提出的6D-VNet是端到端训练的。此外,我们表明,在联合损失中包括平移回归对...原创 2019-12-29 10:51:55 · 1429 阅读 · 0 评论 -
3D Bounding Boxes for Road Vehicles
3D Bounding Boxes for Road Vehicles:A One-Stage, Localization Prioritized Approach Using Single Monocular ImagesAbstract 理解周围物体的三维语义是至关重要的,也是自动驾驶安全角度的一个具有挑战性的需求。我们提出了一种定位优先的方法来有效地定位物体在三维空间中的位置并围绕它...原创 2019-12-22 16:32:29 · 1391 阅读 · 0 评论 -
CDPN解读
关于6-DoF的一些基础的知识点请看上一篇博客。Related work 从RGB图像中识别6-DoF的方法分为直接法和间接法。1. 间接法即不是直接的从RGB图像中恢复出6-DoF的信息,而是现在2维RGB图像和它的3维的模型上建立点到点的对应关系,然后通过数学的方法将旋转量(R)和平移量(T)求解出来。2. 直接法 即不依赖于物体的三维模型,通过神经网络去进行学习,直接从物体的...原创 2019-12-10 18:26:20 · 3385 阅读 · 2 评论 -
6-DoF相关基础知识整理
刚刚接触这个领域,因此打算花点时间先整理一下相关的一些基础的知识。首先是第一个概念一、什么是6-DoF,即6个自由度是什么?首先,先解释一下自由度,自由度与刚体在空间中的运动相关。可以理解为物体移动的不同基本方式。自由度一共有6个,可以分为两种类型:平移和旋转。1. 平移运动 刚体可以在3个自由度中平移:向前/后,向上/下,向左/右2. 旋转运动 刚体在3个自由度中旋转:纵...原创 2019-12-09 20:56:06 · 12819 阅读 · 4 评论 -
CDPN:CoordinatesBased Disentangled Pose Network for Real-Time RGB-Based 6-DoF Object Pose Estimation
ICCV 2019的一篇文章,来自于清华大学。论文链接代码链接翻译 2019-12-09 16:10:00 · 3969 阅读 · 2 评论 -
SSD-6D解读
这是阅读的3D类的第一篇文章,因此可能理解的有点浅显,有错误的地方还望路过的各位大佬告知,小弟在这里先行谢过~本文是基于2D检测器SSD的3D检测器SSD-6D。论文链接测试部分代码1. 综述 许多3D检测器都是基于视角的(view based),生成一系列离散的目标视角用于后续视频序列的特征计算。在测试过程中,从不同的离散视角对场景进行采样,然后计算特征,并与目标数据库匹配来建立训练...原创 2019-12-03 13:36:00 · 3749 阅读 · 0 评论 -
SSD-6D:Making RGB-Based 3D Detection and 6d Pose Estimation Great Again翻译
这是2018的一篇论文,因为最近计划打算参加一个百度发布在Kaggle上的比赛,所以在查阅相关的论文,因为第一次接触,所以在解读的过程中,可能会有一定的缺陷,如果有问题欢迎各位江湖前辈批评指点,在下先行谢过~Abstract我们提出了一个新的方法用于检测3D model的实例和评估他们的6D poses 在单目的RGB数据上。为此,我们扩展了流行的SSD模型。让其覆盖整个6D位姿空间,在 sy...翻译 2019-12-01 10:20:30 · 2582 阅读 · 4 评论 -
从图(Graph)到图卷积(Graph Convolution):漫谈图神经网络(二)
在上一篇博客中,我们简单介绍了基于循环图神经网络的两种重要模型,在本篇中,我们将着大量笔墨介绍图卷积神经网络中的卷积操作。接下来,我们将首先介绍一下图卷积神经网络的大概框架,借此说明它与基于循环的图神经网络的区别。接着,我们将从头开始为读者介绍卷积的基本概念,以及其在物理模型中的涵义。最后,我们将详细地介绍两种不同的卷积操作,分别为空域卷积和时域卷积,与其对应的经典模型。读者不需有任何信号处理方面...转载 2019-11-22 13:11:14 · 1386 阅读 · 0 评论 -
从图(Graph)到图卷积(Graph Convolution):漫谈神经网络(一)
本文为转载文章,已经获得了原作者的转载许可。除了转载的内容外,会加一些自己的理解。因为刚刚接触图卷积,看到了这篇博文,顿时感觉找到了指路明灯,所以打算系统的进行阅读和整理,加深自己的理解和记忆。Begin笔者最近看了一些图与图卷积神经网络的论文,深感其强大,但一些Survey或教程默认了读者对图神经网络背景知识的了解,对未学过信号处理的读者不太友好。同时,很多教程只讲是什么,不讲为什么,也没...转载 2019-11-19 14:34:17 · 3381 阅读 · 0 评论 -
Learning Convolutional Neural Network for Graphs解读
本片论文是2016ICML的一篇论文,将的是如何将CNN应用在graph上的一种新的思路。关于graph 这个数据结构如果不熟悉的话,可以看一下文章末的简单的整理。1.概要 对于图卷积,总体来说,就是用w个固定size=(k+1)的子图来表示输入的graph,再将这w个子图正则化后,生成w(k+1)维的向量,作为传统的CNN网络的输入,进行学习。其实就是做了一个从graph到向量的映射的一个...原创 2019-11-17 14:36:01 · 1053 阅读 · 2 评论 -
范数的理解
在看图卷积的时候,碰到了范数的问题(其实之前也遇到过,但是没有仔细的整理,主要是懒),然后,这次决定查阅一波资料整理一下。1.向量的范数向量的1-范数: ∣∣X∣∣1=∑i=0n∣xi∣||X||_1 = \sum_{i=0}^n |x_i|∣∣X∣∣1=i=0∑n∣xi∣它表示的就是各个元素的绝对值之和。向量的2-范数: ∣∣X∣∣2=(∑i=0nxi2)1/2=∑i=1nxi2|...原创 2019-11-14 22:19:20 · 3429 阅读 · 0 评论