WangKingJ-CSDN博客

原创 Typora+gitee+PicGo+坚果云实现Typora文件的保存完整保存

一直在用Typora，自认为是最好用的markdown编辑器之一，但是比较狗的是不能实现云存储，这两天，因为可能存在换电脑写文档的问题，所以打算把它好好整理整理。坚果云实现文件云同步因为我同步的只是文档，所以坚果云的个人免费版完全就OK啦。坚果云注册—>安装—>使用使用的方式很简单，将你存放markdown文件的文件夹同步到坚果云就好了。gitee建立图床注册gitee账号，然后建立一个全新的仓库，作为Typora图片的存放地。这样仓库就建好了。然后我们需要获取一下私人令牌，

2020-08-17 14:30:06 973

原创 Channel Interaction Networks for Fine-Grained Image Categorization论文解读

来自于码隆科技的2020 AAAI的一篇关于细粒度识别的文章，来自公司论文很不好的一点就是可能不会开源源码，这一点比较遗憾。Contributions提出了一个self-channel interaction（SCI）模块，对图像中不同通道之间的相互作用进行建模，这使它能够捕获每个通道的通道补充信息，从而增强了每个通道学习到的判别特征提出了一个 novel contrastive chan...

2020-04-26 20:38:51 1580

原创 Graph-propagation based Correlation Learning for Weakly Supervised Fine-grained Image Classification

文章提出了一个GCL模型，它主要的创新在于两个部分，其一是criss-cross graph propagation (CGP)，其二是correlation feature strengthening (CFS) ，CGP的目的是用来在区域的discriminative ability学习中，同时考虑全局图像级上下文和局部空间上下文。CFS的目的是用来探索区域特征向量之间的内部语义相关性，以获得...

2020-04-18 21:30:11 1820 7

原创 Learning Attentive Pairwise Interaction for Fine-Grained Classification论文解读

分享的这篇文章来自于AAAI2020，文章的整个思路并不难理解。文章的idea来自于我们人类对相似图像的识别。一般来说，我们识别相似的图像，一方面是去找到图像中特殊的区域来进行识别，另一方面是通过比较图像对来有效地得到对比线索。这篇论文就是从后者获得的灵感。文章提出了Attentive Pairwise Interaction Network (API-Net)，该网络可以通过交互逐步识别一对细...

2020-04-12 21:29:27 2696 7

原创 Fine-grained Recognition: Accounting for Subtle Differences between Similar Classes

符号定义：III是训练的图像，其对应的ground-truth labell∈JJ=1,2,...,Cl\in J J={1,2,...,C}l∈JJ=1,2,...,C是包含所有标签的标签集，M∈RC×H×WM\in R^{C\times H\times W}M∈RC×H×W是Diversification Block的输入，是特定的类别的activation map,M=Mc:c∈[1,C]...

2020-04-10 20:17:22 1046

原创 Attention Convolutional Binary Neural Tree for Fine-Grained Visual Categorization

来自于CVPR2020的一篇文章，原文链接：https://arxiv.org/abs/1909.11378代码发布地址： https://isrc.iscas.ac.cn/gitlab/research/acnet.(应该是暂时还没有发布)论文提出了使用注意力卷积的二叉神经树进行细粒度分类，在树结构的边上进行注意力卷积操作，每个节点使用路由函数来定义从根节点到叶子结点的计算路径，结合所有叶...

2020-04-05 16:51:43 2432 12

原创 Looking for the Devil in the Details

本文是2019年CVPR的一篇文章，作者团队来自于中国科技大学论文链接：https://arxiv.org/abs/1903.06150v1Devil是一个很有意思的名字，让我想起了boss提到的他们家的小公主~contributions提出了一种新颖的三线性注意力采样网络【trilinear attention sampling network】（TASN），以从数百个用于细粒度图像识...

2020-03-27 15:21:33 663

原创 Destruction and Construction Learning for Fine-grained Image Recognition论文解读

2019年CVPR的一篇关于细粒度识别的文章，我觉得论文的名字就很有吸引力，Destruction and Construction Learning(DCL)。贡献提出了一种新颖的“Destruction and Construction Learning（DCL）”框架，以进行细粒度的识别。对于Destruction，region confusion mechanism（RCM）迫使分类...

2020-03-22 20:04:33 871 1

原创 Weakly Supervised Complementary Parts Models for Fine-Grained Image Classification

3.2 Weakly Supervised Object Detection and Instance SegmentationCoarse Object Mask Initialization. 给定一个图像III和它的标签ccc，分类网络的最后的卷积层的特征图被标记为ϕ(I,θ)∈RK×h×w\phi(I,\theta)\in \R^{K\times h\times w}ϕ(I,θ)∈RK...

2020-03-08 21:40:43 2187

原创 Multi-Attention Multi-Class Constraint for Fine-grained Image Recognition论文解读

简介这篇论文是2018 ECCV的一篇论文，提出了一种半监督的细粒度图像识别的网络。细粒度图像识别(Fine-Grained Image Recognition)对于细粒度图像识别，简单的解释就是对于同一个大的类别中，不同子类之间的识别。以狗来进行举例就是，狗是大类，它包含很多的品种，每个品种就可以看做是一个子类。由于受到多种干扰因素的影响，包括物体姿态、视角、光照、遮挡等，通常会使子类之...

2020-03-05 22:02:44 830

原创 CurriculumNet解读

解决的问题一句比较有意思的调侃是，人工智能是先人工后智能，即先有大量的人工的数据标注，然后才能以此训练一个高效的网络。码隆科技2018 ECCV的这篇论文提出了一种训练方法，能够在数据没有或者只有少量人工标注和清洗的情况下，仍然能利用这些噪声数据训练出一个高性能的深度学习模型。方法Overview整个网络的Pipeline包含三个部分：initial features genera...

2020-02-29 19:24:33 457

原创 Label-PEnet解读

这篇论文是码隆科技发表在ICCV 2019的论文，这一研究致力于在仅仅给定图像级别标签的情况下精确地检测与分割物体实例。因为手工标注大量训练数据代价高昂，与监督学习、半监督学习等方式相比，它是更适用于现实应用的技术。与以前那些包含多个离线模块的方法不同的是，本篇论文提出了序列化标签传播与增强网络（缩写为 Label-PEnet）。Label-PEnet 基于一种由粗到细的方式，可以递进地将图像级别...

2020-02-23 21:23:18 1278

原创 Sequential Label Propagation and Enhancement Networks for Weakly Supervised Instance Segmentation

Abstract弱监督实例分割的目的是在只给出图像级标签的情况下，精确地分割对象实例。不像以前的方法是由多个离线阶段组成，我们提出了顺序标签传播和增强网络(称为标签- penet)，它以一种由粗到精的方式逐步地将图像级标签转换为像素级标签: 设计了多标签分类、目标检测、实例细化和实例分割四个级联模块，通过共享主干实现。通过课程学习策略交替地训练级联管道，该策略生成从高级别图像到低级别像素的标记...

2020-02-16 22:55:24 566

原创 Spectral Networks and Deep Locally Connected Networks on Graphs翻译

Aabstract 卷积神经网络在图像和音频识别任务中是非常有效的架构，因为它能够利用信号类在其域中的局部平移不变性。在本文中，我们考虑在没有平移作用的情况下，CNNs可以推广到一般域上定义的信号. 特别地，我们提出了两种结构，一种基于域的层次聚类，另一种基于图拉普拉斯谱。我们通过实验证明，对于低维图，学习卷积层是可能的，它有许多与输入大小无关的参数，从而得到高效的深度架构。1 Intro...

2020-02-12 16:19:21 799

原创 6D-VNet:End-to-End 6DoF Vehicle Pose Estimation from Monocular RGB Images解读

首先是指专注于自动驾驶领域，在这项任务中，交通参与者沿纵轴的平移距离变化比较大，因此，平移的估计是更具有挑战性的。同时，车辆的平移估计比方向估计更为关键。传统的方法是将平移估计作为一个独立的过程，而不是使用几何投影法进行目标类的预测和旋转估计。但是，几何投影法方法是有假设的前提条件的。1、三维物体的中心投影到二维图像的物体的bounding box的中心2、正确估计预测的对象类别和旋转向量...

2019-12-29 22:10:49 706

原创 6D-VNet:End-to-End 6DoF Vehicle Pose Estimation from Monocular RGB Images

Abstract 我们提出了一个概念上简单的6DoF姿态估计网络，尤其是对于自动驾驶场景。在一个单目RGB图像上，我们的方法能够有效的检测交通工具，同时回归它们的三维平移和旋转向量。这个方法叫做6D-VNet，在Mask R-CNN上扩展了一个定制的投网络，以用于检测更好的车辆类比，旋转和平移。与以往的方法相比，本文提出的6D-VNet是端到端训练的。此外，我们表明，在联合损失中包括平移回归对...

2019-12-29 10:51:55 1350

原创 3D Bounding Boxes for Road Vehicles

3D Bounding Boxes for Road Vehicles:A One-Stage, Localization Prioritized Approach Using Single Monocular ImagesAbstract 理解周围物体的三维语义是至关重要的，也是自动驾驶安全角度的一个具有挑战性的需求。我们提出了一种定位优先的方法来有效地定位物体在三维空间中的位置并围绕它...

2019-12-22 16:32:29 1331

原创 CDPN解读

关于6-DoF的一些基础的知识点请看上一篇博客。Related work 从RGB图像中识别6-DoF的方法分为直接法和间接法。1. 间接法即不是直接的从RGB图像中恢复出6-DoF的信息，而是现在2维RGB图像和它的3维的模型上建立点到点的对应关系，然后通过数学的方法将旋转量（R）和平移量（T）求解出来。2. 直接法即不依赖于物体的三维模型，通过神经网络去进行学习，直接从物体的...

2019-12-10 18:26:20 3227 2

原创 6-DoF相关基础知识整理

刚刚接触这个领域，因此打算花点时间先整理一下相关的一些基础的知识。首先是第一个概念一、什么是6-DoF,即6个自由度是什么？首先，先解释一下自由度，自由度与刚体在空间中的运动相关。可以理解为物体移动的不同基本方式。自由度一共有6个，可以分为两种类型：平移和旋转。1. 平移运动刚体可以在3个自由度中平移：向前/后，向上/下，向左/右2. 旋转运动刚体在3个自由度中旋转：纵...

2019-12-09 20:56:06 11318 4

翻译 CDPN:CoordinatesBased Disentangled Pose Network for Real-Time RGB-Based 6-DoF Object Pose Estimation

ICCV 2019的一篇文章，来自于清华大学。论文链接代码链接

2019-12-09 16:10:00 3723 2

原创 SSD-6D解读

这是阅读的3D类的第一篇文章，因此可能理解的有点浅显，有错误的地方还望路过的各位大佬告知，小弟在这里先行谢过~本文是基于2D检测器SSD的3D检测器SSD-6D。论文链接测试部分代码1. 综述许多3D检测器都是基于视角的（view based），生成一系列离散的目标视角用于后续视频序列的特征计算。在测试过程中，从不同的离散视角对场景进行采样，然后计算特征，并与目标数据库匹配来建立训练...

2019-12-03 13:36:00 3610

翻译 SSD-6D：Making RGB-Based 3D Detection and 6d Pose Estimation Great Again翻译

这是2018的一篇论文，因为最近计划打算参加一个百度发布在Kaggle上的比赛,所以在查阅相关的论文，因为第一次接触，所以在解读的过程中，可能会有一定的缺陷，如果有问题欢迎各位江湖前辈批评指点，在下先行谢过~Abstract我们提出了一个新的方法用于检测3D model的实例和评估他们的6D poses 在单目的RGB数据上。为此，我们扩展了流行的SSD模型。让其覆盖整个6D位姿空间，在 sy...

2019-12-01 10:20:30 2506 4

转载从图(Graph)到图卷积(Graph Convolution):漫谈图神经网络(二)

在上一篇博客中，我们简单介绍了基于循环图神经网络的两种重要模型，在本篇中，我们将着大量笔墨介绍图卷积神经网络中的卷积操作。接下来，我们将首先介绍一下图卷积神经网络的大概框架，借此说明它与基于循环的图神经网络的区别。接着，我们将从头开始为读者介绍卷积的基本概念，以及其在物理模型中的涵义。最后，我们将详细地介绍两种不同的卷积操作，分别为空域卷积和时域卷积，与其对应的经典模型。读者不需有任何信号处理方面...

2019-11-22 13:11:14 1354

转载从图(Graph)到图卷积(Graph Convolution):漫谈神经网络(一)

本文为转载文章，已经获得了原作者的转载许可。除了转载的内容外，会加一些自己的理解。因为刚刚接触图卷积，看到了这篇博文，顿时感觉找到了指路明灯，所以打算系统的进行阅读和整理，加深自己的理解和记忆。Begin笔者最近看了一些图与图卷积神经网络的论文，深感其强大，但一些Survey或教程默认了读者对图神经网络背景知识的了解，对未学过信号处理的读者不太友好。同时，很多教程只讲是什么，不讲为什么，也没...

2019-11-19 14:34:17 3278

原创 Learning Convolutional Neural Network for Graphs解读

本片论文是2016ICML的一篇论文，将的是如何将CNN应用在graph上的一种新的思路。关于graph 这个数据结构如果不熟悉的话，可以看一下文章末的简单的整理。1.概要对于图卷积，总体来说，就是用w个固定size=(k+1)的子图来表示输入的graph，再将这w个子图正则化后，生成w(k+1)维的向量，作为传统的CNN网络的输入，进行学习。其实就是做了一个从graph到向量的映射的一个...

2019-11-17 14:36:01 1017 2

原创范数的理解

在看图卷积的时候，碰到了范数的问题(其实之前也遇到过，但是没有仔细的整理，主要是懒)，然后，这次决定查阅一波资料整理一下。1.向量的范数向量的1-范数： ∣∣X∣∣1=∑i=0n∣xi∣||X||_1 = \sum_{i=0}^n |x_i|∣∣X∣∣1=i=0∑n∣xi∣它表示的就是各个元素的绝对值之和。向量的2-范数： ∣∣X∣∣2=(∑i=0nxi2)1/2=∑i=1nxi2|...

2019-11-14 22:19:20 3118

原创 Towards Universal Object Detection by Domain Attention解读

论文地址代码概述论文提出了一个通用的目标检测系统，适应于不同的领域，而且不需要任何的先验知识。该模型基于SENet，将多个SENet得到的特征图连接在一起，并且提出了domain attention，将其施加在连接好的特征图后，这样能够使模型更好地适应不同场景下的目标检测任务。本文的主要工作如下：建立了一个新的benckmark,包括11个不同的目标检测的数据集。提出了一系列系统结...

2019-11-10 14:40:34 902 2

原创 Towards Universal Object Detection by Domain Attention翻译

论文链接Abstract 尽管在视觉识别的通用表示方面的工作越来越多，但很少有人涉及到对象检测。在这篇文章中，我们开发了一个有效且高效的通用对象检测系统，它能够在各种图像领域工作，从人脸和交通标志到医学CT图片。与多领域模型不同，这个通用的模型不需要事先了解感兴趣的区域。它是通过引入一个新的适应层，基于挤压和激励原理，以及一个新的领域关注机制来实现的。在提出的通用检测器中，所有的参数和计算都是...

2019-11-10 12:17:20 437

原创 Relation Networks for Object Detection解读

首先介绍一下这项工作的难点：obiect-to-object关系的建模很困难，因为对象的位置，尺度，类别，数量可能会随着不同的图像变化而变化。深层的卷积神经网络通过大的接受域隐式地合并了上下文信息。本项工作的贡献：提出了一种attention module，在检测的过程中通过利用图像中object之前的相互关系或者图像内容(context)来优化检测效果，同时它不改变特征的维度，能很好的...

2019-10-27 10:44:23 1272

原创用于目标检测的关系网络（Relation networks for Object Detection）翻译

本片论文来自于CVPR2018。Abstract 虽然多年来人们普遍认为对物体之间的关系进行建模有助于物体识别，但是没有证据表明这个观点在深度学习中依旧适用。所有最先进的目标检测系统仍然依赖于单独识别对象实例，而不是在学习过程中利用它们之间的关系。本文提出了一个对象关系模块。它通过一组物体的外观特征和几何形状之间的相互作用来同时处理这些物体，因此，允许对他们的关系进行建模。它是轻量级的，而...

2019-10-26 21:00:07 2564

原创 Mask R-CNN个人理解

一、Mask R-CNNMask R-CNN算法是在Faster R-CNN架构的基础之上的，它主要有两个贡献：1、用更精确RoI Align模块来替换RoI Pooling模块2、从RoI Align模块中插入一个额外的分支----mask 分支这个mask分支的输入为RoI Align 的输出，然后将其输入到两个conv层，conv层的输出就是mask本身。Mask R-CNN的架构...

2019-10-19 21:18:57 1036

原创 Mask R-CNN翻译

Abstract我们提出了一个概念简单、灵活和通用的概念对象实例分割框架。我们的方法有效地检测图像中的对象，同时为每个实例生成高质量的分割掩码。这种方法称为Mask R-CNN，扩展速度更快，通过添加一个分支来预测一个对象掩码，与现有分支并行，用于边界框识别。Mask R-CNN是简单的训练，相对于Faster-RCNN只增加了一个小的开销，每秒5帧。此外,Mask R-CNN很容易推广到其他任...

2019-10-19 15:19:13 714

转载 faster-RCNN论文解析

为了增加自己的理解，本文会从论文的理解和代码的解析两个方面来阐述。一、概述在目标检测领域，faster-RCNN表现出了极强的生命力，是现在很多目标算法的基础，尤其是其核心算法，RPN网络更是很多优秀的检测算法的基础。网络上有很多优秀的论文解读的博客，本文也是以它们作为一个参考，然后再尽力配合一些编程方面的讲解。在编程方面，本文以VGG-16为例。1、1目标从编程的角度的来说，以fast...

2019-10-14 20:35:33 1216

原创 mysql及Navicat for mysql安装

mysql安装建议去官网下载installer,傻瓜式安装，链接www.mysql.com点击 MySQL community(GPL) Download 进入下图界面。点击MySQL Community Server 进入下载界面MySQL推荐的安装方式是installer,点击红圈处~~下载即可安装教程傻瓜式安装的话，只需要打开installer 安装文件，然后一路ne...

2019-09-14 13:35:00 227