论文阅读
文章平均质量分 93
AIHGF
完美一切 一切完美
展开
-
论文阅读理解 - R-FCN: Object Detection via Region-based Fully Convolutional Networks
R-FCN: Object Detection via Region-based Fully Convolutional NetworksPaper Code摘要全卷积网络,全部是卷积层,移除了最后的全连接层(fc).几乎所有的计算都是在整张图像上共享的.position-sensitive score maps 位置敏感分数图, 平衡图像分类所需的平移不变性和目标...原创 2017-06-07 22:56:30 · 2926 阅读 · 0 评论 -
论文阅读学习 - ResNet - Identity Mappings in Deep Residual Networks
论文阅读学习 - ResNet - Identity Mappings in Deep Residual Networks[Paper][Code-Torch - Deep Residual Networks with 1K Layers] 摘要: 对深度残差网络理论分析. 残差构建模块中,采用恒等映射(identity mapping)作为 skip con...原创 2018-03-12 16:45:55 · 840 阅读 · 0 评论 -
论文阅读学习 - Faster R-CNN
Faster R-CNN[Paper - Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks][Code-Caffe] 摘要: 目标检测依赖于 region proposal 算法. Faster R-CNN 提出 Region Proposal Netwo...原创 2017-12-01 11:26:45 · 3993 阅读 · 0 评论 -
论文阅读学习 - CTPN-Detecting Text in Natural Image with Connectionist Text Proposal Network
论文阅读学习 - CTPN-Detecting Text in Natural Image with Connectionist Text Proposal Network[Paper][Code-Caffe][Online Demo] 主要是基于 Faster R-CNN. 根据文字检测场景的特点(水平排列),改进 RPN 网络、Anchors 和 Loss 函数. 关键点:...原创 2018-02-25 10:53:40 · 7183 阅读 · 0 评论 -
论文阅读理解 - Dilated Convolution
Dilated Convolution[Paper]: Multi-scale Context Aggregation by Dilated Convolutions [Caffe-Code]1. Caffe 中的定义Dilated Convolution 已经可在 Caffe 官方的卷积层参数中定义.message ConvolutionParameter { /...原创 2017-09-12 17:21:57 · 11137 阅读 · 1 评论 -
论文阅读学习 - ResNet - Deep Residual Learning for Image Recognition
论文阅读学习 - Deep Residual Learning for Image Recognition[Paper - CVPR2016][Code-Github][ICML2016 tutorial]ResNet 网络已经用于很多应用场景,分类、目标检测、语义分割等等. 再次学习论文. 残差学习框架 ——使网络更深. ResNet 152层网络,是 VG...原创 2018-02-11 11:11:20 · 1217 阅读 · 0 评论 -
论文阅读理解 - Automatic Spatially-aware Fashion Concept Discovery
论文阅读理解 - Automatic Spatially-aware Fashion Concept Discovery[Paper - Automatic Spatially-aware Fashion Concept Discovery - ICCV2017][Fashion200K - Dataset] 主要是应用属性(Attributes)在图片中的空间位置信息,表现为 a...原创 2018-01-31 10:25:26 · 1560 阅读 · 0 评论 -
论文阅读理解 - Look into Person: Self-supervised Structure-sensitive Learning
Look into Person: Self-supervised Structure-sensitive Learning and A New Benchmark for Human ParsingCode-CaffePaper 摘要—— 主要两部分:(1)建立Look into Person(LIP)数据集;(2)提出self-supervised structure-sens...原创 2017-10-14 17:55:32 · 2278 阅读 · 0 评论 -
论文阅读理解 - CenterLoss: A Discriminative Feature Learning Approach
CenterLoss - A Discriminative Feature Learning Approach for Deep Face Recognition[Paper][Caffe-Code] 摘要: Center Loss For Face Recognition - 提高CNN学习的特征的判别能力. Center Loss 通过学习每一类的深度特征的...原创 2017-11-16 10:52:42 · 4259 阅读 · 0 评论 -
论文阅读学习 - 深度学习网络模型分析对比
深度学习网络模型分析对比[Paper - An Analysis of Deep Neural Network Models for Practiacal Applications]从准确率Accuracy、内存占用Memory Footprint、参数量Parameters、计算量(运算次数)Operations Count、推断时间Inference Time 和 功耗Power Co...原创 2018-03-13 15:05:48 · 2411 阅读 · 1 评论 -
VGGNet 阅读理解 - Very Deep Convolutional Networks for Large-Scale Image Recognition
论文理解 - VGGNet - Very Deep Convolutional Networks for Large-Scale Image Recognition[VGG-Paper][原文地址 - Very deep convolutional networks for large-scale image recognition] 一篇对 VGGNet 理解比较详细的博客,很长...转载 2018-03-19 17:32:38 · 51563 阅读 · 4 评论 -
论文阅读 - Group Normalization
原文: 论文阅读 - Group Normalization - AIUAI题目:Group Normalization - ECCV2018作者:Yuxin Wu,Kaiming He团队:FAIR<Group Normalization for Mask R-CNN - Detectron>Batch Normalization(BN) 是沿着 batch 维度进行归...原创 2018-10-31 20:25:59 · 1137 阅读 · 0 评论 -
论文阅读 - Semantic Soft Segmentation
论文阅读 - Semantic Soft Segmentation - AIUAI原创 2018-08-01 21:31:14 · 3430 阅读 · 0 评论 -
论文阅读理解 - Convolutional Pose Machines
论文阅读理解 - Convolutional Pose Machines[Paper - CVPR2016][Code - Caffe][Code - TensorFlow 1.0+] 基于序列化的全卷积网络结构,学习空间信息和纹理信息,估计人体姿态. 摘要: Pose Machines 是一种序列化的预测框架,可以学习信息丰富的空间信息模型. C...原创 2018-03-21 18:09:01 · 10710 阅读 · 23 评论 -
论文阅读学习 - (DeeplabV3+)Encoder-Decoder with Atrous Separable Convolution
论文阅读学习 - (DeepLabV3+)Encoder-Decoder with Atrous Separable Convolution for Semantic Image Segmentation[Paper][Code-TensorFlow] 摘要: 空间金字塔池化模块(spatial pyramid pooling,SPP) 和 编码-解码结构(encode-...原创 2018-03-14 16:57:25 · 8408 阅读 · 0 评论 -
论文阅读理解 - SSD: Single Shot MultiBox Detector
SSD: Single Shot MultiBox DetectorPaperSlideCode-Caffe 摘要 SSD,一次深度神经网络前馈来进行目标检测. 通过对不同 scales 的各 feature map 位置,根据不同的 aspect ratios,将 bounding boxes 的输出空间离散化为 default boxes 集合. 在预测阶段,...原创 2017-10-20 17:08:40 · 2737 阅读 · 2 评论 -
论文实践讨论 - Pyramid Scene Parsing Network
From Github Issues of PSPNetPSPNetauthor’s answerfor the training, the issues are mainly related to bn layer:原创 2017-06-06 10:55:08 · 2387 阅读 · 0 评论 -
论文阅读理解 - (Deeplab-V3)Rethinking Atrous Convolution for Semantic Image Segmentation
Deeplab-V3Rethinking Atrous Convolution for Semantic Image Segmentation[Paper][Code-TensorFlow]摘要DeeplabV1&amp;V2 - 带孔卷积(atrous convolution), 能够明确地调整filters的接受野(field-of-view),并决定DNN计算得...原创 2017-07-18 17:32:34 · 30510 阅读 · 14 评论 -
AlexNet 阅读理解 - ImageNet Classification with Deep Convolutional Neural Networks
论文理解 - ImageNet Classification with Deep Convolutional Neural Networks[AlexNet - Paper][原文地址] 关于 AlexNet 的介绍. 博主 Yuens 对论文和网络结构理解真心透彻,膜拜. 转载并非常感谢原博主 - Yuens’s Blog.这篇文章是Alex Krizhevsk...转载 2018-03-19 22:51:06 · 20392 阅读 · 1 评论 -
论文阅读学习 - Hard-Aware Deeply Cascaded(HDC) Embedding
Hard-Aware Deeply Cascaded(HDC) Embedding[Paper-version1][Paper-version2][Code-Caffe] 摘要: 深度度量学习基本目标是,使相同类别的图片间的距离比不同类别的图片间的距离小. 由于优化问题,通常采用 hard example mining 来只对样本的 hard 子集进行处理...原创 2017-11-27 16:23:36 · 2630 阅读 · 0 评论 -
论文阅读理解 - Panoptic Segmentation 全景分割
论文阅读理解 - Panoptic Segmentation 全景分割[Paper] 摘要 新的任务场景 —— 全景分割 Panoptic Segmentation: 统一了实例分割(Instance Segmentation) 和语义分割(Semantic Segmentation). 实例分割 - 检测每个 object instance,并进行...原创 2018-01-15 13:21:46 · 24817 阅读 · 1 评论 -
论文阅读理解 - DeepFashion: Powering Robust Clothes Recognition and Retrieval with Rich Annotations
DeepFashion: Powering Robust Clothes Recognition and Retrieval with Rich Annotations[Paper][Project][Dataset][fashion-detection-Code]1. DeepFashion Dataset综合性强(Comprehensiveness) —— 标注信...原创 2017-10-24 13:51:59 · 5361 阅读 · 0 评论 -
论文阅读学习 - Fast R-CNN
Fast R-CNN Fast R-CNN - Fast Regin-based Convolutional Network for Objection Detection[Paper][Code-Caffe]1. R-CNNR-CNN 采用深度网络来对 object proposals 分类以进行目标检测,其缺点如下:训练是 multi-stage 的.a...原创 2017-10-31 21:01:54 · 1387 阅读 · 0 评论 -
论文阅读理解 - Deep Metric Learning via Lifted Structured Feature Embedding
Deep Metric Learning via Lifted Structured Feature EmbeddingPaperCaffe-Code 摘要 - 提出一种样本间距离度量方法,其出发点在于,(一)学习样本语义特征嵌入,使得在语义嵌入空间中,相似样本映射距离更接近,不相似样本映射距离更远. (二)更好的利用网络训练中 batch 训练的优势,提出将一个 batch 内样...原创 2017-09-21 17:54:49 · 6528 阅读 · 0 评论 -
论文阅读理解 - Learning Spatial Regularization for Multi-label Image Classification
Learning Spatial Regularization with Image-level Supervisionsfor Multi-label Image Classification[Caffe-Code]论文主要通过采用 Attention Model 学习图像的多标签间的关系,然后作为多标签图像分类的空间正则项进行模型训练.1. 摘要多标签图像分类问题通过利用...原创 2017-08-31 17:30:43 · 4515 阅读 · 2 评论 -
论文阅读理解 - Zero-shot Image Tagging by Hierarchical Semantic Embedding
Zero-shot Image Tagging by Hierarchical Semantic Embedding[Code]许多细粒度视觉类别的标签获取较为困难,zero-shot 图像标注(image tagging) 旨在采用训练样本中不存在的新标签来标注图像. 现在通常做法是,采用神经语言模型(neural language model) 训练得到语义空间,将图像和标签投影到...原创 2017-09-05 11:38:01 · 2510 阅读 · 0 评论 -
论文阅读理解 - Human Attribute Recognition by Deep Hierarchical Contexts
Human Attribute Recognition by Deep Hierarchical Contexts基于深度层次内容信息的人体属性识别[Projects]1. 摘要训练CNN网络,以从所有检测部位中选取最具描述属性的人体部分;并结合整体人体作为归一化的姿态深度表示. 采用从以人为中心层次到场景层次的深度层次内容信息,进一步提升识别结果. 以人为中心的内容信...原创 2017-09-04 10:52:11 · 3083 阅读 · 0 评论 -
论文阅读理解 - Part-based clothing image annotation by visual neighbor retrieval
Part-based clothing image annotation by visual neighbor retrieval[Paper]服装图像标注比较具有挑战性,由于衣服的形变大、人体姿态和背景的影响.part-based 服装图像标注基于 pose 检测和 part-based 特征对齐来消除服装形变的影响;同时考虑 tag 相关性和 tag 显著性(saliency...原创 2017-08-17 11:33:32 · 933 阅读 · 0 评论 -
论文阅读理解 - Pyramid Scene Parsing Network
# Pyramid Scene Parsing Network[Project] [Code-Caffe] [Paper] [Slides]PSPNet 特点: * 场景标注 Scene parsing * 全局内容信息 global context information * different-regionbased context aggregation * p...原创 2017-06-15 17:52:11 · 12978 阅读 · 0 评论 -
论文阅读学习 - Center Loss: Caffe 实现
Center Loss - Caffe实现原创 2017-11-16 13:08:48 · 2444 阅读 · 0 评论 -
论文阅读理解 - Learning Feature Pyramids for Human Pose Estimation
Learning Feature Pyramids for Human Pose Estimation[Paper][Code-Torch] 在 Inference 时,Pyramids 类方法被广泛用于处理 scale 变化. 提出 Pyramid Residual Module(PRMs) —— 金字塔残差模块,来增强 DCNNs 的尺度不变性(invarian...原创 2017-12-16 09:41:23 · 4492 阅读 · 1 评论 -
论文阅读学习 - Deep Representation Learning with Target Coding
Deep Representation Learning with Target Coding[Project HomePage][Paper - AAAI2015][Supplementary Doc][Code-cuda-convnet]1-of-K code:长度为 KKK 的向量,第 kkk 个元素为 1,其它的为 0. [分类任务]Target code:mult...原创 2018-01-19 15:02:35 · 1198 阅读 · 0 评论 -
论文阅读实践 - 基于CNN的年龄和性别分类
基于CNN的年龄和性别分类学习论文 Age and Gender Classification using Convolutional Neural Networks. 主要是针对年龄和性别分别建立分类问题,基于CaffeNet,年龄转化为 8 类别、性别为 2 分类问题,训练两个网络模型,实现原理较为直接简单.项目路径源码路径年龄分类网络结构 - 对应caffemodel...原创 2017-08-28 09:57:04 · 2101 阅读 · 0 评论 -
论文阅读理解 - ResNeXt - Aggregated Residual Transformations for DNN
ResNeXt - Aggregated Residual Transformations for Deep Neural Networks[Paper][Code-Torch][Code-PyTorch][Code-Keras][Code-Caffe][Code-Tensorflow] 摘要: 高度模块化的网络结构,用于图像分类; 通过重复 b...原创 2017-12-20 16:13:57 · 9883 阅读 · 3 评论 -
论文实践学习 - Multi-Context Attention for Human Pose Estimation
类似于 论文实践学习 - Stacked Hourglass Networks for Human Pose Estimation ,基于Docker-Torch,估计人体关节点. 这里只简单进行测试估计结果,由于显存有限,未能加入所有的 scale_search.[Torch-Code][Pre-trained model] 1. 图片人体姿态估计 - demo.lua...原创 2017-09-09 11:21:31 · 3302 阅读 · 6 评论 -
论文阅读理解 - Deep Learning of Binary Hash Codes for Fast Image Retrieval
Deep Learning of Binary Hash Codes for Fast Image Retrieval[Paper][Code-Caffe]1. 摘要针对图像检索问题,提出简单有效的监督学习框架CNN网络结构能同时学习图像特征表示以及 hash-like 编码函数集合利用深度学习以逐点(point-wise)的方式,得到二值哈希编码(binary has...原创 2017-08-10 17:49:41 · 2912 阅读 · 0 评论 -
论文阅读学习 - Batch Normalization
Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift[Paper]在 PSPNet 与 DeeplabV3中,有对 BN 层对语分割有效性的使用,故再次对 BN 层提出的论文阅读学习,并理解其 Caffe 实现.DeeplabV3 中关于 Batch No...原创 2017-12-11 21:00:56 · 1306 阅读 · 0 评论 -
论文阅读理解 - Stacked Hourglass Networks for Human Pose Estimation
Stacked Hourglass Networks for Human Pose Estimationkeywords人体姿态估计 Human Pose Estimation 给定单张RGB图像,输出人体某些关键点的精确像素位置. 全卷积网络 Stacked Hourglass Networks 多尺度特征 Features processed across all scale...原创 2017-05-25 17:48:02 · 18299 阅读 · 48 评论 -
论文阅读理解 - Multi-Context Attention for Human Pose Estimation
Multi-Context Attention for Human Pose Estimation[Paper][Torch-Code][valse2017/ppt] 整合多内容信息注意力机制(multi-context attention mechanism)到CNN网络,得到人体姿态估计 end-to-end 框架. 采用堆积沙漏网络(stacked hourglass n...原创 2017-09-08 17:25:29 · 7149 阅读 · 0 评论 -
MIT 深度学习基础Slides
MIT Deep LearningGithub - MIT Deep Learning作者:Lex FridmanDeep Learning Basics 课程中对应的 PPT.MIT《深度学习基础》第一课68分钟视频+69页PPT - 新智元...原创 2019-02-27 23:03:32 · 534 阅读 · 0 评论