计算机视觉
文章平均质量分 73
chiyustory
一直在进步
展开
-
MobileNetV1和V2详解
Mobile Net V1 摘要 本文提出MobileNets的高效模型,用于移动端设备的视觉应用。该网络基于深度可分离卷积来构建轻量级深度神经网络,另外,该网络引入了两个简单的全局超参数(分辨率因子和宽度因子),可以在延迟和...原创 2018-10-08 16:04:55 · 4486 阅读 · 0 评论 -
FCN算法详解
基于全卷积网络的语义分割1. 摘要 卷积网络是一种强大的视觉模型,可产生特征的层次结构。卷积网络在语义分割方面的应用已超过了最先进的水平。本文关键是建立“全卷积”网络,它接受任意大小的输入,并通过有效的前向传播产生相应大小的输出。本文定义并详细描述了全卷积网络的空间,解释了它们在空间稠密预测任务中的应用,并...原创 2018-12-02 09:28:55 · 39970 阅读 · 0 评论 -
车牌分类
车牌分类任务任务描述:对1700多张图片(包含蓝、绿、黄、白四种颜色牌照的车)进行分类。但是车牌区域在整张图片的占比非常小,所以首先依据标注的坐标将车牌裁剪出出来,然后用此裁剪后的图像进行四分类任务。本任务代码已经上传至github中。需要解决的问题:保证网络结构最简、计算复杂度低,但同时需保证Recall、Precision...原创 2018-07-18 13:39:18 · 2397 阅读 · 1 评论 -
GoogLeNet分类结构(V1、V2)
1.算法思想 GoogleLeNet是在AlexNet、VGG分类网络之后出现的新的分类网络,其解决的问题获得更加高级的特征且同时减少训练参数。 GoogLeNet共有22层(卷积),其中包含9个线性堆叠的Inception模块,且在最后一个Inception模块处使用全局平均池化。2.InceptionV1结构 首先对前层特征图进...原创 2019-01-21 15:23:39 · 2748 阅读 · 0 评论 -
TextSnake算法
1. 摘要 在深度神经网络和大规模数据集的推动下,自然场景文本检测方法在过去的几年里取得了巨大的进步,不断刷新各种基准记录。然而,如下图所示,受到描述文本表征(水平矩形框、旋转矩形框或任意四边形框)的限制,现有的方法在处理更自由形式的文本实例(例如弯曲文本)时可能会表现的差强人意,而这些文本实例往往在实际中非常常见。为了解决这个问题,本文提出了一种更灵活的场景文本表征,称为Tex...原创 2019-01-28 15:37:48 · 2696 阅读 · 4 评论 -
ResNet和ResNeXt分类结构
1.神经网络是否越深越好? 随着神经网络层数的增多,则对输入图像提取的特征将会更加抽象,这是因为后层神经元的输入是前层神经元的累加和,而特征的抽象程度越高,更有利于后期的分类任务或回归任务。2.是否可以无限增加神经网络层数? 神经网络层数增加会导致梯度消失或梯度爆炸问题,以往的解决方法是输入标准化和批标准化。但当层数继续增加到一定程度时,训练集和测试机准确率都...原创 2019-01-23 16:54:05 · 4772 阅读 · 3 评论 -
Batch Normalization层
1. 两种数据分析常用的标准化预处理方法a. min-max归一化将原始数据映射到[0,1]区间上。b. z-score标准化将原始数据处理为均值为0,方差为1的正态分布。标准化的作用:消除数据分析过程中不同样本之间的差异(量纲的差异)标准化代码:import numpy as npx1 = np.array([-1,-2,-3,-4,-5])x2...原创 2018-07-27 15:32:24 · 453 阅读 · 0 评论 -
目标检测算法评估
本文是对论文《Object count/Area Graphs for the Evaluation of Object Detection and Segmentation Algorithms》的部分理解翻译,用于学习对文本检测算法的评估!!! 目标检测和分割算法的评估1. 摘要 目标检测算法的评估是一项non-trivi...原创 2018-05-17 22:19:14 · 1977 阅读 · 0 评论 -
EAST算法详解
EAST:高效而准确的场景文本检测1. 摘要 以前的场景文本检测方法已经在各种基准测试中取得了良好的效果。但是,这些方法即使使用深度神经网络模型,在处理具有挑战性的场景时也通常具有不足之处。这是因为文本检测的整体性能取决于pipelines中多个阶段和各部分的相互作用,而简单的pipeline能够集中精...原创 2018-06-18 14:54:54 · 37206 阅读 · 11 评论 -
目标检测基础知识
1. 目标检测 “目标检测”主要解决两个问题:图像上多个目标在哪里(位置),是什么(类别)人们一般把其发展历程分为3个阶段: a.传统的目标检测方法 b.两阶段检测器 以R-CNN为代表的结合region proposal和CNN分类的目标检测框架(R-CNN, SPP-NET, Fast R-CNN,Faster R-CNN, R-FCN) c. 单阶段检...原创 2018-06-18 22:21:43 · 2556 阅读 · 0 评论 -
YOLO详解
1.摘要 本文提出一种新的目标检测方法YOLO。相比于以前的目标检测分类器,本文将目标的边界框检测和类别概率预测统一为一个回归问题,使得神经网络在预测时可直接从原始输入图像中预测边界框坐标和所属类别的概率。由于整个检测pipeline是单个网络,因此可以实现端到端预测(原始图像到输出的映射)。 本文的基础YOLO模型可以45帧/秒的速度实时处理图像,而较小版本的...原创 2018-07-05 11:13:04 · 2654 阅读 · 0 评论 -
计算不规则四边形(多边形)的面积
本文代码用于比较计算不规则四边形的面积的两种方法(海伦公式和向量积),因为本人最近在研究目标检测的问题,当标记目标是以不规则四边形标注或多边形时,需要基于此面积计算Recall,Precision,IoU来评价模型。1. 海伦公式和向量积公式海伦公式和向量积计算不规则四边形的面积,都是以计算三角形面积为基础。海伦公式:(看代码)向量积:https://blog.csdn.net/l...原创 2018-07-25 16:13:47 · 18878 阅读 · 2 评论 -
车牌检测
车牌检测回归任务任务描述:1. 随机生成车牌检测图像(即假设车牌区域是蓝色,其余区域是黑色),其中车牌大小是不规则的,并划分训练集和测试集2. 检测出测试图像中的车牌区域的坐标解决方法一:可以通过基于OpenCV的方法检测出来此车牌(函数get_plate_four_coord);解决方法二:基于神经网络进行回归预...原创 2018-07-18 16:49:49 · 1594 阅读 · 0 评论 -
神经网络模型的各种优化算法
1.批量梯度下降算法(Batch Gradient Descent)思想:基于整个训练集的损失迭代更新梯度。优点: 1. 由于梯度更新考虑的是全局的损失,所以不会陷入局部最优;缺点: 1. 由于计算的是整个训练集的损失,所以每次迭代的计算量较大,占用内存大;公式理解:更新参数向使得损失减小的方向变化。2.随机梯度下降算法思想:基于随机选取的...原创 2018-08-02 15:38:39 · 14883 阅读 · 0 评论