Deep Learning
文章平均质量分 69
零尾
为了艾泽拉斯
展开
-
论文笔记34 -- (自动驾驶)【CVPR2021】SE-SSD: Self-Ensembling Single-Stage Object Detector From Point Cloud
LiDAR only一阶段的3D目标检测网络论文:点这里代码:点这里Wu Zheng,Weiliang Tang,Li Jiang,Chi-Wing FuThe Chinese University of Hong KongAbstract文章提出了一种Self-Ensembling的单级目标检测器(SE-SSD),用于室外点云的三维目标检测。其重点是利用soft(teacher模型预测)目标和hard(标注信息)目标以及制定的约束来联合优化模型,且不在推理中引入额外计算。具体来说,SE-原创 2022-04-15 15:20:12 · 3495 阅读 · 1 评论 -
论文笔记33 -- (CV)【ICCV2021】Swin Transformer: Hierarchical Vision Transformer using Shifted Windows
CV + Transformer论文:点这里官方代码:点这里第三方代码:点这里Ze Liu,Yutong Lin,Yue Cao,Han Hu,Yixuan Wei,Zheng Zhang,Stephen Lin,Baining GuoMicrosoft Research AsiaAbstract本文介绍了一种称为 Swin Transformer 的新的视觉 Transformer,它可以作为计算机视觉的通用 backbone。从语言到视觉的转换面临的挑战来自于两个领域之间的差异,例如视原创 2021-10-15 14:33:56 · 963 阅读 · 0 评论 -
论文笔记33 -- (细粒度识别)【CVPR2021】TransFG: A Transformer Architecture for Fine-grained Recognition
Transformer在细粒度领域的应用论文:点这里代码:点这里Ju He,Jie-Neng Chen,Shuai Liu,Adam Kortylewski,Cheng Yang,Yutong Bai,Changhu Wang,Alan YuilleJohns Hopkins University,ByteDance Inc.Abstract细粒度视觉分类(FGVC)的目的是从子类别中识别目标,因为类间存在着固有的细微差异,因此是一项非常具有挑战性的任务。最近的工作主要是通过定位最具辨别力的原创 2021-09-07 10:46:44 · 2040 阅读 · 0 评论 -
论文笔记32 -- Conformer: Local Features Coupling Global Representations for Visual Recognition
CNN + Transformer论文:点这里代码:点这里Zhiliang Peng,Wei Huang,Shanzhi Gu,Lingxi Xie,Yaowei Wang,Jianbin Jiao,Qixiang Ye国科大,华为,鹏城实验室Abstract在卷积神经网络 (CNN) 中,卷积操作擅长提取局部特征,但难以捕获全局表示。在Visual Transformer中,级联自注意力模块可以捕获长距离特征依赖关系,但不幸的是会破坏局部特征细节。在本文中,我们提出了一种称为 Confor原创 2021-09-02 14:56:05 · 5253 阅读 · 1 评论 -
论文笔记31 -- (ReID)【ICCV2021】TransReID: Transformer-based Object Re-Identification
ICCV 2021,首个将Transformer用于Re-ID的工作TransReID在行人和车辆重识别任务上均表现SOTA!论文:点这里代码:点这里Shuting He,Hao Luo, Pichao Wang, Fan Wang, Hao Li, Wei JiangAlibaba Group, Zhejiang UniversityICCV 2021Abstract提取鲁棒的特征表示是目标重新识别(ReID)的关键挑战之一。虽然基于卷积神经网络(CNN)的方法取得了巨大的成功,但它们原创 2021-09-01 14:34:24 · 2525 阅读 · 1 评论 -
论文笔记29 -- (Vehicle ReID)Going Beyond Real Data: A Robust Visual Representation for Vehicle Re-id
《Going Beyond Real Data: A Robust Visual Representation for Vehicle Re-identification》这是AI City Challenge 2020 Track2(Vehicle ReID)第一名郑哲东大佬的解决方案!!!论文:点这里代码:点这里Zhedong Zheng,Minyue Jiang,Zhigang Wang,Jian Wang,Zechen Bai,Xuanmeng Zhang,Xin Yu,Xiao Tan,原创 2021-02-01 17:52:25 · 996 阅读 · 1 评论 -
论文笔记28 -- (Vehicle ReID)VOC-ReID: Vehicle Re-identification based on Vehicle-Orientation-Camera
《VOC-ReID: Vehicle Re-identification based on Vehicle-Orientation-Camera》,这是AI City Challenge 2020 Track2(Vehicle ReID)第二名的解决方案!!!原创 2021-01-28 15:30:22 · 2178 阅读 · 1 评论 -
论文笔记27 -- (视频压缩)Learned Video Codec with Enriched Reconstruction for CLIC P-frame Coding
《Learned Video Codec with Enriched Reconstruction for CLIC P-frame Coding 》20年12月提交在arXiv上的一篇paper,一个新的基于深度学习的端到端视频编解码框架,看到有大佬已经解读,跟着学习一下!!!论文:点这里David Alexandre, Hsueh-Ming HangDept. of Electronics Engineering, National Chiao Tung University, Taiwan原创 2021-01-07 16:16:43 · 707 阅读 · 1 评论 -
论文笔记26 -- (视频压缩)【CVPR2020】M-LVC: Multiple Frames Prediction for Learned Video Compression
《M-LVC: Multiple Frames Prediction for Learned Video Compression 》DVC的升级版!!!论文:点这里代码:点这里Jianping Lin, Dong Liu, Houqiang Li, Feng WuCVPR 2020Abstract1. Introduction2. Related Work2.1. Learned Image Compression2.2. Learned Video Compression3. P原创 2020-11-10 15:11:58 · 1633 阅读 · 1 评论 -
论文笔记25 -- (视频压缩)OpenDVC: An Open Source Implementation of the DVC Video Compression Method
DVC的TensorFlow开源实现!!!DVC是首个端到端优化的深度学习视频压缩方法,在深度视频压缩领域常被视为基准算法。OpenDVC则是瑞士苏黎世联邦理工学院杨韧等人使用Tensorflow复现了DVC并开源了代码(不单是复现,还对DVC做了优化)。原创 2020-10-13 15:08:23 · 2627 阅读 · 0 评论 -
论文笔记23 -- (ReID)Receptive Multi-granularity Representation for Person Re-Identification
《Receptive Multi-granularity Representation for Person Re-Identification 》论文:点这里Guanshuo Wang, Yufeng Yuan, Jiwei Li, Shiming Ge, Xi Zhou作者单位:上海交大, 云从科技, 中科院这是云从在全国人工智能大赛2019行人重识别赛道冠军方案中所用的方法,在Market-1501上可达到90%的mAP和96.2%的Rank-1,已收录于TIP 2020。原创 2020-09-25 14:35:02 · 855 阅读 · 0 评论 -
论文笔记22 -- (Vehicle ReID)Multi-Domain Learning and Identity Mining for Vehicle Re-Identification
这是AI City Challenge 2020 Track2(Vehicle ReID)第三名的解决方案,出自罗浩团队!!!原创 2020-06-17 14:04:39 · 2369 阅读 · 1 评论 -
论文笔记20 --(ReID)Learning Generalisable Omni-Scale Representations for Person Re-Identification
《Learning Generalisable Omni-Scale Representations for Person Re-Identification 》论文:https://arxiv.org/abs/1910.06827Kaiyang Zhou, Xiatian Zhu, Yongxin Yang, Andrea Cavallaro, Tao Xiang(Submitted o...原创 2019-10-18 16:09:54 · 1116 阅读 · 5 评论 -
论文笔记5 --(ReID)Diversity Regularized Spatiotemporal Attention for Video-based Person Re-id
https://arxiv.org/pdf/1803.09882.pdfAbstract原创 2018-12-20 11:17:04 · 2463 阅读 · 0 评论 -
论文笔记4 --(ReID)Re-ranking Person Re-identification with k-reciprocal Encoding
《Re-ranking Person Re-identification with k-reciprocalEncoding》论文:https://arxiv.org/abs/1701.08398v1GitHub:https://github.com/zhunzhong07/person-re-ranking这是CVPR2017的一篇paperAbstract当将person re-...原创 2018-12-06 17:39:27 · 14416 阅读 · 9 评论 -
论文笔记1 --(YOLOv2)YOLO9000:Better,Faster,Stronger
论文链接:https://arxiv.org/abs/1612.08242主要包括三个部分:Better,Faster,Stronger,其中前面两部分基本上讲的是YOLO v2,最后一部分讲的是YOLO9000。Better这部分细节很多,要详细了解的话还是需要结合源码来看。本篇论文是YOLO作者为了改进原有的YOLO算法所写的。YOLO有两个缺点:(1)定位不准确(2)和基于r...原创 2018-09-29 11:43:01 · 23073 阅读 · 13 评论 -
论文笔记3 --(ReID)In Defense of the Triplet Loss for Person Re-Identification
(1) 设计了新的Triplet Loss,并和其它变种进行了对比;(2) 对于是否需要pre-trained模型,进行了实验对比分析。原创 2018-11-27 11:05:40 · 11686 阅读 · 7 评论 -
Person Re-ID相关知识点、数据集及评估指标汇总
0. 背景人脸识别技术目前已发展的较为成熟,在很多场景与产品中都已有落地的应用,但人脸识别技术只能用到人体的人脸信息,而人体的其他重要信息得不到充分的利用,例如:衣着、姿态、行为等。另外在应用时必须要有清晰的人脸正面照片,但在很多场景下无法满足要求,例如低头、背影、模糊身形、帽子遮挡等等。行人重识别(Person Re-ID)技术正好能够弥补人脸识别的这些不足之处,行Person Re-ID能...原创 2018-12-05 11:47:54 · 10530 阅读 · 5 评论 -
DarkNet(2)--修改Python调用接口,支持输入numpy图片
DarkNet源码中提供的接口,用Python处理一张图片的时候,只能传入图片路径,见python/darknet.py的demo。if __name__ == "__main__": net = load_net("cfg/tiny-yolo.cfg", "tiny-yolo.weights", 0) meta = load_meta("cfg/coco.d原创 2018-11-27 15:36:50 · 3891 阅读 · 1 评论 -
论文笔记2 --(ReID) Learning Discriminative Features with Multiple Granularities for Person Re-id
本文的主要思想就是通过区域分割,来获得不同粒度的特征,比如全局和局部特征以及更细粒度的局部特征,通过一个网络的不同分支得到这些特征,每个分支都对不同的分割块进行特征提取。原创 2018-11-27 09:58:59 · 7789 阅读 · 0 评论 -
Ubuntu--(资源监控)CPU+内存、GPU+显存
CPU+内存安装htop$ sudo apt-get install htop启动$ htopGPU+显存$ watch -n 1 nvidia-smi原创 2018-12-04 11:06:30 · 3179 阅读 · 0 评论 -
Caffe(13)--(SSRNet模型)Keras转Caffe教程
SSR-Net: A Compact Soft Stagewise Regression Network for Age Estimationpaper:https://github.com/shamangary/SSR-Net/blob/master/ijcai18_ssrnet_pdfa_2b.pdf1.SSRNet模型Demo(1)源码:https://github.com/shama...原创 2018-11-20 11:57:30 · 5075 阅读 · 20 评论 -
DarkNet(1)--添加新层教程(slice层为例)
1、源码src文件夹下:新建slice_layer.c和slice_layer.hps:稍后我会放到我的GitHub上2、makefile文件中:OBJ添加slice_layer.o3、include/darknet.h文件中:(1)LAYER_TYPE添加SLICE:typedef enum { CONVOLUTIONAL, DECONVOLUTIONAL, ...原创 2018-11-22 15:19:49 · 2848 阅读 · 1 评论 -
NCNN(2)--网络结构文件.param解析
LeNet模型为例由Caffe的lenet_deploy.prototxt文件转换得到name: "LeNet"layer { name: "data" type: "Input" top: "data" input_param { shape: { dim: 1 d原创 2018-10-09 16:06:06 · 8982 阅读 · 5 评论 -
YOLOv2--region层源码分析
YOLOv2论文中算法的其它细节见:YOLOv2–论文学习笔记(算法详解)YOLOv2损失函数的定义在darknet/src/region_layer.c文件中region_layer.c内容如下:#include "region_layer.h"#include "activations.h"#include "blas.h"#include "box.h&原创 2018-09-29 11:18:38 · 3779 阅读 · 0 评论 -
深度学习实战教程(1)--手机跑目标检测(YOLO,从DarkNet到Caffe再到NCNN完整打通)
https://github.com/lwplw这篇打算就直入主题了,YOLO是什么、DarkNet是什么、Caffe是什么、NCNN又是什么…等等这一系列的基础科普这里就完全不说了,牵扯实在太多,通过其他帖子有一定的积累后,看这篇就相对容易了。本文核心:把一个目标检测模型跑到手机上下面开工:1、训练得到一个目标检测模型目前可以做目标检测的模型有很多,比如R-CNN、Fast R-CN...原创 2018-10-11 17:44:58 · 43205 阅读 · 38 评论 -
论文笔记7 --(ReID)Video-based Person Re-identification via Self Paced Weighting
《Video-based Person Re-identification via Self Paced Weighting》,http://mmap.whu.edu.cn/wp-content/uploads/2017/11/aaai-18_wenjun_huang.pdf这是AAAI2018的一篇关于视频Person Re-ID的论文,作者从自身的步态考虑,将行人的视频序列分成多个子序列,然...原创 2018-12-28 14:04:01 · 1913 阅读 · 1 评论 -
论文笔记8 --(ReID)Camera Style Adaptation for Person Re-identification
《Camera Style Adaptation for Person Re-identification》论文:https://arxiv.org/abs/1711.10295v1Abstract作为一项跨相机检索任务,由于摄像机的不同,person re-id会收到图像风格变化的影响。在以往的方法中,网络去潜在的学习不受相机风格影响的特征,而本文提出一个camera style (Ca...原创 2018-12-28 14:20:09 · 4897 阅读 · 2 评论 -
论文笔记9 -- Residual Attention Network for Image Classification
论文:《Residual Attention Network for Image Classification》https://arxiv.org/abs/1704.06904https://github.com/fwang91/residual-attention-network这是CVPR2017的一篇论文,在图像分类问题上,首次成功将极深卷积神经网络与人类视觉注意力机制进行有效的结合,...原创 2019-01-03 18:00:08 · 5399 阅读 · 0 评论 -
TensorFlow--SummaryWriter改为tf.summary.FileWriter
不推荐使用SummaryWriter ._ init_(来自tensorflow.python.training.summary_io),将在2016-11-30之后删除。 更新说明: 请切换到tf.summary.FileWriter接口和行为是相同的; 这只是一个重命名。原创 2017-02-08 14:07:42 · 18667 阅读 · 5 评论 -
论文笔记19 --(ReID)Orthogonal Center Learning with Subspace Masking for Person Re-Identification
《Orthogonal Center Learning with Subspace Masking for Person Re-Identification 》论文:https://arxiv.org/abs/1711.10295v1这是Tencent Youtu X-lab的一篇。Abstract原创 2019-09-29 17:36:21 · 920 阅读 · 0 评论 -
论文笔记13 -- (层次聚类)Performance guarantees for hierarchical clustering
《Performance guarantees for hierarchical clustering》论文:http://cseweb.ucsd.edu/~dasgupta/papers/hier-jcss.pdfGitHub:https://github.com/jonfink/hclusterAbstract作者表示,对于任何度量空间中的任何数据集,都可以构建一个层次聚类,保证对于...原创 2019-03-13 17:29:41 · 1022 阅读 · 0 评论 -
论文笔记14 --(ReID)Spectral Feature Transformation for Person Re-identification
《Spectral Feature Transformation for Person Re-identification》论文:https://arxiv.org/abs/1811.11405这是图森2018年11月提交到arxiv上的一篇文章。用ResNet提取2048-d feature,然后再对batch内所有image根据视觉相似性(visual similarity)建图(这里...原创 2019-03-17 19:16:20 · 1699 阅读 · 0 评论 -
论文笔记18 --(ReID)Spatial-Temporal Person Re-identification
《Spatial-Temporal Person Re-identification》论文:https://arxiv.org/abs/1812.03282?context=csGitHub:https://github.com/Wanggcong/Spatial-Temporal-Re-identification这篇是中山大学赖剑煌老师团队发表在AAAI2018上的一篇paper。这篇...原创 2019-03-19 19:04:19 · 3183 阅读 · 0 评论 -
论文笔记17 --(ReID)SCPNet: Spatial-Channel Parallelism Network for Joint Holistic and Partial ...
《SCPNet: Spatial-Channel Parallelism Network for Joint Holistic and Partial Person Re-Identification》论文:https://arxiv.org/pdf/1810.06996.pdfGitHub:https://github.com/xfanplus/Open-SCPNet这是发表在ACCV2...原创 2019-03-19 18:00:22 · 1913 阅读 · 0 评论 -
论文笔记16 --(ReID)Batch Feature Erasing for Person Re-identification and Beyond
《Batch Feature Erasing for Person Re-identification and Beyond》论文:https://arxiv.org/abs/1811.07130GitHub:https://github.com/daizuozhuo/batch-feature-erasing-network类似mgn的切分,而且这篇是站在mgn之上看切分问题的。文章号称...原创 2019-03-19 17:54:10 · 840 阅读 · 0 评论 -
论文笔记15 --(ReID)SphereReID: Deep Hypersphere Manifold Embedding for Person Re-Identification
《SphereReID: Deep Hypersphere Manifold Embedding for Person Re-Identification》论文:https://arxiv.org/pdf/1704.08063.pdfGitHub:https://github.com/wy1iu/sphereface就是用了个新损失,softmax的变种,但有人指出跟coco loss是一...原创 2019-03-19 17:34:01 · 1486 阅读 · 0 评论 -
论文笔记11 --(ReID)Deep Group-shuffling Random Walk for Person Re-identification
论文:《Deep Group-shuffling Random Walk for Person Re-identification》https://arxiv.org/abs/1807.111784. Experiments4.1. Datasets and metric4.2. Implementation details我们网络中的成对亲和力CNN采用ResNet-50 [11]网...原创 2019-01-10 11:04:41 · 1619 阅读 · 3 评论 -
论文笔记10 --(ReID)Human Semantic Parsing for Person Re-identification
论文:《Human Semantic Parsing for Person Re-identification》https://arxiv.org/pdf/1804.00216.pdfAbstract原创 2019-01-09 17:38:13 · 1587 阅读 · 0 评论 -
PyTorch源码解析--torchvision.transforms(数据预处理、数据增强)
PyTorch框架中有一个很常用的包:torchvisiontorchvision主要由3个子包构成:torchvision.datasets、torchvision.models、torchvision.transforms详细内容可参考:http://pytorch.org/docs/master/torchvision/index.htmlGitHub:https://github.c...原创 2019-01-04 14:52:48 · 19968 阅读 · 8 评论