算法
神经病研究神经网络
路漫漫其修远兮,吾将上下而求索
展开
-
实时语义分割
感觉自己实时语义分割这一块关注的比较少,所以挖个坑,慢慢填。经典坑:BiSeNet (Bilateral Segmentation Network):https://arxiv.org/pdf/1808.00897.pdf原创 2021-09-07 08:20:50 · 404 阅读 · 0 评论 -
目标检测向:SSD: Single Shot MultiBox Detector
论文地址:https://arxiv.org/abs/1512.02325代码地址:https://github.com/weiliu89/caffe/tree/ssdAbstract作者如何定义的SSD?将bbox的输出空间离散化为一系列位于每张特征图位置上的、不同长宽比和大小的default boxes,对于default boxes,我们可以将其理解为faster r-...原创 2018-08-08 10:23:42 · 214 阅读 · 0 评论 -
人群密度估计向:人群密度估计现有主要数据集特点及其比较
ShanghaiTech dataset总共1198张标记图片,数据集分为两部分part_A和part_B,part_B部分的图片相较于part_A部分的图片人群分布更为稀疏。MCNN中首次建立该数据集,part_A部分300张用于训练,182张用于测试;part_B部分400张用于训练,316张用于测试。WorldExpo's dataset总共3980张标记图片,其中33...原创 2018-08-10 15:47:49 · 5578 阅读 · 0 评论 -
人群密度向:CMTL
论文地址:https://arxiv.org/pdf/1707.09605.pdf代码地址:https://github.com/svishwa/crowdcount-cascaded-mtlAbstract提出了一种新的端对端的级联神经网络同时学习人群数量分类以及密度图估计;将人群数量分成不同的组别等价于粗略地对人群数目进行估计,之后其可以作为一个高水平的先验信息加入到密度...原创 2018-08-03 17:10:44 · 1439 阅读 · 3 评论 -
目标检测向:Single-Shot Refinement Neural Network for Object Detection
论文地址:https://arxiv.org/pdf/1711.06897.pdf代码地址:https://github.com/sfzhang15/RefineDet摘要继承单阶段和二阶段模型优点,叫做RefineDet。RefineDet由两个内部相互连接的模块组成,即,Anchor Refinement Module(ARM)和Object Detection Modu...原创 2018-06-27 17:13:02 · 647 阅读 · 0 评论 -
实验向:fast-neural-doodle 复现+实现
下载镜像:$ sudo docker pull docker pull kaixhin/cuda-torch:8.0 (https://hub.docker.com/r/kaixhin/cuda-torch/)安装python相关packages新建一个requirements,包含以下内容:python + numpy + scipy + h5py + sklearn + ...原创 2018-06-24 16:46:08 · 392 阅读 · 0 评论 -
实验向:Deep Forest 复现与自己数据的实现
花了半天不到的时间看了一下论文,论文地址:https://arxiv.org/abs/1702.08835本身做图像比较多,机器学习比较少,以下只是我简单粗浅的理解。摘要优点:在small-scale数据集上表现良好;可以处理各类数据,结构化数据,文本数据,图像数据等等等。1. Introduction所谓gcForest,指的是multi-Grained Cascade...原创 2018-05-31 23:04:49 · 5670 阅读 · 10 评论 -
实验向:neural-doodle & fast neural-doodle demo 复现流程
论文地址:https://arxiv.org/abs/1603.01768# 采用docker形式进行,$ docker pull alexjc/neural-doodle:gpu# 然后克隆仓库,$ git clone https://github.com/alexjc/neural-doodle.git# 接下来用alias对命令进行简化,关于alias命令的用法,见:ht...原创 2018-05-29 11:05:55 · 828 阅读 · 1 评论 -
人群密度估计向:Towards perspective-free object counting with deep learning
Abstract主要目的,解决图片中目标实例计数问题。主要有两个贡献,第一,提出了一种全新的CNN,叫做Counting CNN(CCNN)。CCNN是利用回归进行建模,网络通过学习将image patches映射为相应的密度图;第二,提出了一个scale-ware的counting model,叫Hydra CNN,可以在不提供任何图片的几何信息的情况下,估计出不同拥挤情景下的密度图。Hyd...原创 2018-05-16 20:57:31 · 888 阅读 · 0 评论 -
目标检测向:You Only Look Once: Unified, Real-Time Object Detection
Abstract作者将目标检测当作回归问题来处理,以此来解决目标检测中的bbox定位和相关类别概率预测问题。同SOTA的检测系统相比,YOLO在定位问题上出错概率更大,而在背景预测的问题上,fpr显著地更小。1. Introduction无论是在训练还是在测试的时候,YOLO处理的水平都是在整张图片上进行的,因此它很轻易地就可以对背景信息的类别和外表进行编码。YOLO的泛化性...原创 2018-05-16 16:21:25 · 810 阅读 · 0 评论 -
实验向:FCIS(Fully Convolutional Instance-aware Semantic Segmentation)-MxNet版本的实现
FCIS-MxNet1. 首先进行一波无脑安装MxNet: http://mxnet.incubator.apache.org/install/index.htmlPip安装太慢太恶心, 选择了源码安装方式2. 按照https://github.com/msracver/FCIS 上的安装方式一路下来就好3.报错OSError: libcudart.so.8.0: cannot ...原创 2018-05-15 09:14:37 · 1626 阅读 · 3 评论 -
目标检测向:Fast R-CNN
Abstract1. Introduction背景:现有的SOTA都是通过multi-stage pipelines的方式,这样会导致速度降低,模型较为复杂。挑战:需要预先加工出proposals 后续需要对这些较为不精确的proposals进行refine解决办法:提出一个单阶段训练算法,可以同时学会对proposals进行分类以及refine空间位置。...原创 2018-05-18 21:31:54 · 223 阅读 · 0 评论 -
目标检测向:YOLO9000:Better, Faster, Stronger
Abstract通过某种联合训练的方式,使得YOLO9000可以对尚未进行标记过得类别数据上对该类别进行预测。1. Introduction提出一种新的方式对大量已有分类数据进行管理,并且将其利用来扩大现有检测系统的类别数目 提出一种新的训练算法,可以使得同时在检测和分类数据上同时进行训练,利用检测数据来精确定位目标,利用分类数据来增大vocabulary和鲁棒性...原创 2018-05-18 20:05:08 · 399 阅读 · 0 评论 -
数据结构向:《大话数据结构》ch3 线性表
3.2 线性表的定义线性表(List):零个或多个数据元素的有限序列需要注意:线性表是一个序列,即元素之间是有顺序的;线性表是有限的。如果用数学语言定义如下:ai若将线性表记为(a1, ..., ai-1, ai, ai+1, ..., an),则表中ai-1领先于ai,ai领先于ai+1,称ai-1是ai的直接先驱元素,ai+!是ai的直接后继元素。当i=1,2,...,n-1时...原创 2018-03-28 14:49:13 · 208 阅读 · 2 评论 -
数据结构向:《大话数据结构》ch2 笔记
算法是解决特定问题求解步骤的描述,在计算机中表现为特定指令的有限序列,并且每条指令表示一个或多个操作符。算法具有5个基本特性:输入、输出、有穷性、确定性和可行性。1.输入:算法具有0个或多个输入2.输出:算法至少有1个或多个输出3.有穷性:算法在执行有限的步骤之后,自动结束而不会出现无限循环,并且每一个步骤在可接受的时间内完成4.确定性:算法的每一步骤都具有确定的...原创 2018-03-26 16:20:33 · 187 阅读 · 0 评论