KFXW的专栏

学海无涯苦作舟

排序:
默认
按更新时间
按访问量

[深度学习论文笔记][arxiv 1804]ExFuse: Enhancing Feature Fusion for Semantic Segmentation

这篇文章着重研究语义分割网络中高低层特征融合的效率问题。在很多工作中,融合不同尺度的特征是提高分割性能的一个重要手段。低层特征分辨率更高,包含更多位置、细节信息,但是由于经过的卷积更少,其语义性更低,噪声更多。高层特征具有更强的语义信息,但是分辨率很低,对细节的感知能力较差。如何将两者高效融合,取...

2018-05-22 23:41:45

阅读数:2

评论数:0

[深度学习论文笔记][CVPR 18]Path Aggregation Network for Instance Segmentation

本文提出了名为PANet的网络结构,用于物体检测(object detection)和实例分割(instance segmentation)任务。该网络基于FPN[1]和Mask RCNN[2]模型之上提出了三点创新,显著地提升了模型在物体检测和实例分割网络上的性能

2018-03-12 17:32:35

阅读数:325

评论数:0

[深度学习论文笔记][CVPR 17 oral]A-Fast-RCNN: Hard Positive Generation via Adversary for Object Detection

这篇文章提出了一种新的对手生成策略,通过训练提升检测网络对遮挡、形变物体的识别精度。遮挡和形变是检测任务中影响模型性能的两个显著因素。增加网络对遮挡和形变的鲁棒性的一个方式是增加数据库的体量。但是由于遮挡的图片一般都处在图像分布的长尾部分,即便增加数据,遮挡和形变的图片仍是占比较少的部分。另一个思...

2018-02-23 01:03:14

阅读数:102

评论数:0

[深度学习论文笔记][ICLR 18]mixup: BEYOND EMPIRICAL RISK MINIMIZATION

[ICLR 18]mixup: BEYOND EMPIRICAL RISK MINIMIZATION Hongyi Zhang, Moustapha Cisse, Yann N. Dauphin and David Lopez-Paz from MIT & FAIR paper l...

2018-01-31 00:41:50

阅读数:453

评论数:0

latex中如何使表格被文字环绕

有时为了充分利用文档空间,需要让宽度较小的表格被文字环绕,做到如下效果 为了实现此效果,可以使用warpfig包。可在此处下载。使用方法如下: \usepackage{wrapfig} \begin{wraptable}{r}{4.3cm} \centering \begin{tabu...

2018-01-23 16:46:44

阅读数:368

评论数:0

Latex表格大小调整常见问题汇总

列宽调整 若要调整每列的宽度到指定数值,可以将代码中的 \begin{tabular}{c|ccc} 改为 \begin{tabular}{p{xxx}|ccc} 其中花括号里面填写宽度数值,如5pt,10mm等。如果需要该列居中,可以写作 \begin{tabular}{...

2018-01-03 18:04:36

阅读数:1800

评论数:0

[深度学习论文笔记][arxiv 1711]Learning to Segment Every Thing

这是一篇在实例分割问题(instance segmentation)中研究扩展分割物体类别数量的论文。目前instancce segmentation任务分类种类过少主要是因为分割标注的数量较少,而检测框的标注已经覆盖了非常多的种类,比如Visual Genome数据库。如果要拓展可分割物体类别数...

2017-11-30 20:28:22

阅读数:1804

评论数:0

[深度学习论文笔记][ICCV 17]Semi Supervised Semantic Segmentation Using Generative Adversarial Net

第一篇将GAN应用在分割中的文章来自于[1]。在此之后出现的GAN+语义分割的文章也基本遵从[1]中的思路,即在传统语义分割训练框架中加一个adversarial loss,将分割网络视作生成器。这篇文章则是从另一个角度考虑问题,即将分割网络视作判别器,使用GAN的生成器扩展训练数据,从而提升训练...

2017-11-27 22:20:16

阅读数:577

评论数:0

[深度学习论文笔记][arxiv 1711] Non-local Neural Networks

在这篇文章中,作者提出了一种非局部模块(non-local block, 简称NL block)的网络结构,来帮助深度网络更好地融合非局部的信息。这对于一些问题是非常重要的。

2017-11-26 00:07:24

阅读数:1897

评论数:0

如何debug caffe中的cu文件

对caffe、mxnet等框架的cu文件一直是一个很让人头疼的问题,特别是涉及跟进kernel函数的操作时,用cout打印变量的方式不能奏效。本文将介绍使用cuda-gdb对caffe的cu文件进行debug的方法。本文默认你的驱动、CUDA、OPENCV等caffe所需环境已经配置好,不再赘述此...

2017-11-01 21:18:05

阅读数:697

评论数:0

[深度学习论文笔记][IJCAI 17]Beyond Universal Saliency - Personalized Saliency Prediction with Multi-task CNN

这篇文章针对的问题是显著性检测(saliency detection)中的人眼注意力预测(eye fixation prediction)任务。这篇文章主要有两点贡献: 1. 首先提出人眼注意力是因人而异的,而不应该是如之前的研究认为的不同人的注意力区域是统一的; 2. 提出了一个多任务网络结构框...

2017-10-14 20:40:09

阅读数:377

评论数:0

[深度学习论文笔记][ICCV 17 oral]Binarized Convolutional Landmark Localizers for Human Pose Estimation and...

这篇文章是对特征点定位网络(pose estimation & facial landmark detection)进行加速和压缩的工作。文章以Hour-Glass[1]模型为出发点,利用二值化网络[2,3]的转化方式修改模型结构。另外根据二值化网络中出现的特有现象改进网络中residua...

2017-09-28 21:21:12

阅读数:772

评论数:0

在caffe.proto中定义变量出现“'xxxParameter' has no member named 'xxx'”问题的解决

在caffe.proto中某一message添加成员变量时,最好避免使用大写字母。在编译过程中message里的成员变量名会自动将所有字母变为小写。如果在C++代码中仍然使用带有大写字母的变量时则会产生找不到定义的问题。

2017-09-27 11:14:52

阅读数:279

评论数:0

在caffe中使用C++ 11特性的编译问题

有时在编写caffe代码时为了简便可能会使用C++98之后的一些新特性,如果不对caffe的默认编译选项进行修改则会产生诸如“xxx is not a member of 'std'”或者某些函数没有匹配声明的错误。例如C++11新增的一些特性如:numeric中的iota函数、可以自定义比较操作...

2017-09-27 10:53:11

阅读数:785

评论数:2

无联网条件下的Docker部署

Docker在无联网条件下的部署十分简单。只需要一台联网的电脑和优盘即可完成这个过程。

2017-09-25 10:11:07

阅读数:514

评论数:0

[深度学习论文笔记][总结]Invariant gait feature extraction based on image transformation

近期有两篇来自于同一第一作者单位的工作,使用基于神经网络的图像变换模型来处理不同视角、不同衣着或手持物的CEI特征到统一的90°正常特征(SPAE与GaitGAN)。在这里加以简单总结与对比。

2017-09-07 17:14:32

阅读数:565

评论数:2

[深度学习论文笔记][PAMI 17]A Comprehensive Study on Cross-View Gait Based Human Identification wit

这篇文章是第一篇将深度学习引入步态识别任务的工作。文章的重点是在CASIA-B数据库上针对多视角和多行走状态的问题进行研究。模型在CASIA-B、OU-IRIS以及USF数据库上都有很好的性能表现。

2017-09-07 14:44:15

阅读数:992

评论数:11

步态识别问题简介

步态识别问题简介任务介绍步态识别是生物特征识别方法的一种。其基本目标是通过获取一段待检测行人正常行走的视频,与已经存储好的行人行走视屏做对比,找出待检测行人的对应于数据库中人物的身份。其优点在于检测的过程无感、非接触、不需要其它人为参与。在数据库中存储的视频被称为gallery,用来作为测试输入、...

2017-09-07 10:41:04

阅读数:1376

评论数:3

[深度学习论文笔记][arxiv 1702]Understanding Convolution for Semantic Segmentation

这篇文章提出了对深度语义分割网络的两点改进,包括: 1. 一种高效上采样方法以恢复分割结果的分辨率(Dense Upsampling Convolution, DUC); 2. 一种改进了的洞算法/膨胀卷积操作(Hybrid Dilated Convolution, HDC)。

2017-08-23 19:31:43

阅读数:483

评论数:0

caffe编译时出现undefined reference错误的原因与解决办法

在make caffe项目的时候,可能会在最后的CXX/LD部分遇到libcaffe.so的链接过程出现undefined reference错误。此类错误出现的原因可能是.so文件进行链接时,其中的符号在链接路径中无法找到。也可能是.so等待链接的符号没有定义。

2017-08-16 20:35:47

阅读数:1533

评论数:2

提示
确定要删除当前文章?
取消 删除
关闭
关闭