目标检测
mrcoderrev
C
展开
-
AlexNet:ImageNet Classification with Deep Convolutional Neural Networks
这个神经网络有6000万参数,和650000个神经元,包含5个卷积层(某些卷积层后面带有池化层)和3个全连接层,最后一个是1000维的softmax。为了防止过拟合,使用了dropout的正则化方法。使用了120万高分辨率图像分到1000个不同的类别中。使用了非饱和的神经元并对卷积操作进行了非常有效的GPU实现。cnn的前面部分,卷积-激活函数-降采样-标准化。AlexNet论文翻译—...原创 2019-12-01 10:14:16 · 219 阅读 · 0 评论 -
归一化/标准化/正则化
为什么要进行归一化和标准化?因为特征间的单位尺度可能不同,可能会导致计算结果也不同,尺度大的会起决定性作用,为了消除特征间的单位和尺度差异和影响,以对每维特征同等看待,需要对特征进行归一化操作。因尺度差异,其损失函数的等高线可能是椭圆形,梯度方向垂直于等高线,下降会走zigzag路线,而不是指向local minimum,通过对特征进行平均值为0方差为1的变换后,其损失函数的等高线更接近圆形,...原创 2019-11-18 23:59:00 · 350 阅读 · 0 评论 -
梯度下降法(全局gGD和随机gSGD)
梯度下降法分为全局梯度下降和随机梯度下降全局梯度法训练的时候用的是所有的训练样本gGD=1n∑i=1nΔθL(xi,yi,θt)g_{GD} = {{1} \over {n}}\sum_{i=1}^{n}\Delta_{\theta}L(x^{i},y^{i},\theta_{t})gGD=n1∑i=1nΔθL(xi,yi,θt)θt+1=θt−ηgGD\theta_{t+1} =...原创 2019-11-17 12:47:53 · 997 阅读 · 0 评论 -
YOLOv3: An Incremental Improvement
摘要(1)比V2体积更大,精度更高,但是速度仍有保障(2)输入320/*320的图片后,v3能在22ms内处理完成,并取得28.2mAP,精度和SSD相当,但速度快上3倍。介绍更新2.1边框预测V3用逻辑回归预测每个边界框的objective score。如果当前预测的边界框比之前的更好的与ground truth对象重合,那他的分数就是1,如果当前的预测不是最好的但是和ground ...原创 2019-11-06 16:12:07 · 157 阅读 · 0 评论 -
softmax和交叉熵
softmax用于多分类过程中,往往加在神经网络的他将多个神经元的输出,映射到(0,1)区间内,看成概率来解,这些值的累和为1,在选取输出节点的时候选取概率最大的节点作为我们的预测目标,从而进行多分类。Si=ei(∑jej)S_{i} = { \frac{e_{i}} {\choose\sum_{j}e^{j}} }Si=(∑jej)eisoftmax 相关求导当对分类的Loss进...原创 2019-11-04 15:48:46 · 487 阅读 · 0 评论 -
环境配置
找cuda:ls /usr/bin/cuda查看GPU型号:nvidia-sml下载与cpu对应的pytorch,例如:pip install https://download.pytorch.org/whl/cu90/torch-1.1.0-cp37-cp37m-linux_x86_64.whlpytorch下载网站:https://download.pytorch.org/whl/cu...原创 2019-10-31 20:03:00 · 189 阅读 · 0 评论 -
YOLO9000: Better, Faster, Stronger
1.介绍(1)大多数检测方法受限于小目标(2)YOLOv2可以检测9000多种不同的物体更好(1)由于YOLO的缺点,我们的目标是提高召回和定位,同时保持分类的准确性。(2)我们不是扩展我们的网络,而是简化我们的网络,然后使表示更容易学习。...原创 2019-10-27 10:02:12 · 244 阅读 · 0 评论 -
目标检测20年
00原创 2019-10-18 10:47:57 · 246 阅读 · 0 评论 -
You Only Look Once: Unified, Real-Time Object Detection
摘要(1)将目标检测的设计看做是一个回归问题,从空间上分割边界框和类别的概率。(2)在一次评估中,仅用一个神经网络就能预测整张图像的边界框和类别概率。(3)特点:1.检测速度非常快。2.与其他实时检测系统相比能实现较高的mAP。3.与其他先进的检测模型相比,定位误差更高,但不太可能将背景检测成目标(FP)。4.能够学到非常泛化的表示。1 介绍(1)RPN网络的一些弊端:1.使用...原创 2019-10-13 23:52:59 · 314 阅读 · 0 评论 -
目标检测历史进展
早期目标检测流程(1)候选框生成(2)特征向量提取(3)区域分类DeepLearning 时代目标检测(1)二阶检测器(如CNN,(R-CNN)及其变体) 首先使用候选框生成器生成稀疏的候选框集,然后使用深度卷积网络编码生成候选框的特征向量,最后使用区域分类器预测候选框区域类别(2)一阶检测器(如YOLO) 直接对特征图像上的每个位置进行类别预测二阶检测器性能更优,一阶...原创 2019-10-18 10:47:36 · 525 阅读 · 0 评论