2018年05月_神经病研究神经网络

原创实验向：Deep Forest 复现与自己数据的实现

花了半天不到的时间看了一下论文，论文地址：https://arxiv.org/abs/1702.08835本身做图像比较多，机器学习比较少，以下只是我简单粗浅的理解。摘要优点：在small-scale数据集上表现良好；可以处理各类数据，结构化数据，文本数据，图像数据等等等。1. Introduction所谓gcForest，指的是multi-Grained Cascade...

2018-05-31 23:04:49 5730 10

原创实验向：neural-doodle & fast neural-doodle demo 复现流程

论文地址：https://arxiv.org/abs/1603.01768# 采用docker形式进行，$ docker pull alexjc/neural-doodle:gpu# 然后克隆仓库，$ git clone https://github.com/alexjc/neural-doodle.git# 接下来用alias对命令进行简化，关于alias命令的用法，见：ht...

2018-05-29 11:05:55 875 1

原创目标检测向：Fast R-CNN

Abstract1. Introduction背景：现有的SOTA都是通过multi-stage pipelines的方式，这样会导致速度降低，模型较为复杂。挑战：需要预先加工出proposals 后续需要对这些较为不精确的proposals进行refine解决办法：提出一个单阶段训练算法，可以同时学会对proposals进行分类以及refine空间位置。...

2018-05-18 21:31:54 233

原创目标检测向：YOLO9000:Better, Faster, Stronger

Abstract通过某种联合训练的方式，使得YOLO9000可以对尚未进行标记过得类别数据上对该类别进行预测。1. Introduction提出一种新的方式对大量已有分类数据进行管理，并且将其利用来扩大现有检测系统的类别数目提出一种新的训练算法，可以使得同时在检测和分类数据上同时进行训练，利用检测数据来精确定位目标，利用分类数据来增大vocabulary和鲁棒性...

2018-05-18 20:05:08 430

原创人群密度估计向：Towards perspective-free object counting with deep learning

Abstract主要目的，解决图片中目标实例计数问题。主要有两个贡献，第一，提出了一种全新的CNN，叫做Counting CNN（CCNN）。CCNN是利用回归进行建模，网络通过学习将image patches映射为相应的密度图；第二，提出了一个scale-ware的counting model，叫Hydra CNN，可以在不提供任何图片的几何信息的情况下，估计出不同拥挤情景下的密度图。Hyd...

2018-05-16 20:57:31 921

原创目标检测向：You Only Look Once: Unified, Real-Time Object Detection

Abstract作者将目标检测当作回归问题来处理，以此来解决目标检测中的bbox定位和相关类别概率预测问题。同SOTA的检测系统相比，YOLO在定位问题上出错概率更大，而在背景预测的问题上，fpr显著地更小。1. Introduction无论是在训练还是在测试的时候，YOLO处理的水平都是在整张图片上进行的，因此它很轻易地就可以对背景信息的类别和外表进行编码。YOLO的泛化性...

2018-05-16 16:21:25 828

原创实验向：FCIS(Fully Convolutional Instance-aware Semantic Segmentation)-MxNet版本的实现

FCIS-MxNet1. 首先进行一波无脑安装MxNet: http://mxnet.incubator.apache.org/install/index.htmlPip安装太慢太恶心，选择了源码安装方式2. 按照https://github.com/msracver/FCIS 上的安装方式一路下来就好3.报错OSError: libcudart.so.8.0: cannot ...

2018-05-15 09:14:37 1663 3

原创目标检测向：Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition (SPP-net)

SPP-net同时解决了CNN要求输入固定尺寸图片的限制以及R-CNN速度的限制。IntroductionCNN要求固定尺寸图片，一般的解决办法都是通过crop或者warp，前者会损失图片内容，而后者会导致图片扭曲。那么为什么CNN需要固定输入图片的尺寸呢？主要是因为全连接层，全连接层上参数的数目是固定的，因此要求输入特征维度也是一定的，卷积过程中特征维度是不会改变的，因此我们只能通...

2018-05-12 21:16:41 187

原创课程学习向：cs231n : Convolutional Neural Networks

关于CIFAR-10分类问题的一个简单的卷积神经网络结构：[INPUT- CONV - RELU - POOL - FC]INPUT: 32x32x3的原始图片CONV：选择12个filters，得到的输出维度为32x32x12（？？？）RELU：是一个elementwise的activation函数，输出维度仍然为32x32x12POOL：进行一个下采样操作，得到的输出维度为...

2018-05-07 18:45:07 241

原创 Rich feature hierarchies for accurate object detection and semantic segmentation Tech report (v5)

Abstract背景：（1）目前最好的方法主要是用复杂的ensemble模型将底层的图片特征同高层的语义特征进行结合作者方法的特点：（1）将高容量的CNN用于自底向上的region proposals；（2）当训练数据较少时，将有监督的预训练作为辅助任务，然后紧接着做一个domain-specific的fine-tuning，效果同样可以达到很好的提升R-CNN名字由来为combine regio...

2018-05-06 19:03:28 372

原创 cs231n : Transfer Learning

所谓Transfering learning实际上，很少人会从头开始训练一个完整的卷积神经网络（而且初始化是随机的），因为拥有足够多的数据集的概率是很小的。相反，通常的做法是在一个很大的数据集，比如ImageNet（包含1000个类别的1.2m张图片）上预训练，然后将这个卷积神经网络作为我们感兴趣的任务的初始化或者固定特征提取器。迁移学习的三个主要场景如下：1. 卷积神经网络作为特征提取器获取一个...

2018-05-03 13:56:00 335

原创分割向：Learning to segment everything

同样是来自FAIR之作。摘要现有实例分割方法需要所有的训练实例都被标记。然而标记这些实例的成本是很大的。本篇文章的目的是提出一种新的偏监督训练方法以及一种全新的权重迁移函数。文章实现了在一个所有类别都被打上了bbox框但是只有其中一小部分有mask标注的数据集上进行训练的目标。这一贡献使得我们能够训练Mask R-CNN使用来自于Visual Genome数据集中的对于3000个visual co...

2018-05-01 11:29:55 2124

weixin_40516558的博客