计算机视觉
张学渣
ISCAS小硕一枚~ 阿里云CV算法工程师
展开
-
理解分组卷积与深度可分离卷积
这两种卷积分别是在ResNext论文与MobileNet系列中体现的,貌似Xception中也有深度可分离卷积的体现。作用都很简单,为了降参。目录1. 分组卷积 group convolution2 深度可分离卷积depthwise separable convolution1. 分组卷积 group convolution最早出现分组卷积的是AlexNet,说实话网...原创 2020-04-09 16:24:50 · 2989 阅读 · 0 评论 -
准确率、精确率、召回率、F1值、ROC/AUC整理笔记
对于二分类问题,机器预测的和实际的还是会有所偏差,所以我们引入以下几个概念来评价分类器的优良。一、TP、TN、FP、FN概念首先有关TP、TN、FP、FN的概念。大体来看,TP与TN都是分对了情况,TP是正类,TN是负类。则推断出,FP是把错的分成了对的,而FN则是把对的分成了错的。(我的记忆方法:首先看第一个字母是T则代表分类正确,反之分类错误;然后看P,在T中则是正类,若在F中则实际为...原创 2019-03-13 16:50:30 · 3630 阅读 · 0 评论 -
浅谈计算机视觉中的注意力机制
视觉注意力机制是人类视觉所特有的大脑信号处理机制。人类视觉通过快速扫描全局图像,获得需要重点关注的目标区域,也就是一般所说的注意力焦点,而后对这一区域投入更多注意力资源,以获取更多所需要关注目标的细节信息,而抑制其他无用信息。这是人类利用有限的注意力资源从大量信息中快速筛选出高价值信息的手段,是人类在长期进化中形成的一种生存机制,人类视觉注意力机制极大地提高了视觉信息处理的效率与准确性。计算机...原创 2019-03-19 16:07:31 · 8870 阅读 · 2 评论 -
mmdetection训练自己的数据
上篇文章提到了mmdetection的配置并且测试好啦。下面关于如何train我们自己的数据。主要讲一下一些改动原配置文件的问题,毕竟mmdetection开源的时间不长,还是在不断更新的。官方建议自己的数据在mmdetection目录下创建data目录,以coco数据格式为例吧。mmdetection├── mmdet├── tools├── configs├── data...原创 2019-01-09 14:22:37 · 21526 阅读 · 38 评论 -
MS COCO数据集目标检测评估
1. Detection Evaluation本页介绍了COCO使用的检测评估指标。此处提供的评估代码可用于在公开可用的COCO验证集上获得结果。它计算下面描述的多个指标。为了在COCO测试集上获得结果,其中隐藏了实际真值注释,必须将生成的结果上传到评估服务器。下面描述的评估代码用于评估测试集的结果。2. Metrics(指标) Precision 准确率。表示正确识别物体A的...转载 2019-01-02 21:28:27 · 1676 阅读 · 0 评论 -
【深度学习/目标检测】详解 ROI Align 的基本原理和实现细节
尊重作者,转载网址。ROI Align 是在Mask-RCNN这篇论文里提出的一种区域特征聚集方式, 很好地解决了ROI Pooling操作中两次量化造成的区域不匹配(mis-alignment)的问题。实验显示,在检测测任务中将 ROI Pooling 替换为 ROI Align 可以提升检测模型的准确性。...转载 2019-01-04 09:58:14 · 1813 阅读 · 0 评论 -
【目标检测】cascade R-CNN论文的理解
Cascade R-CNN: Delving into High Quality Object Detection1.思想简介2.相关工作及一些证明Iterative BBox及对比Iterative Loss3.Cascade R-CNN的实现与结果4.总结Cascade R-CNN: Delving into High Quality Obj...原创 2019-01-03 20:52:51 · 410 阅读 · 0 评论 -
【目标检测】对FPN(特征金字塔网络)论文的理解
这篇paper我认为算是对用卷积神经网络进行目标检测的一种改进,通过提取多尺度的特征信息进行融合,进而提高目标检测的精度,特别是在小物体检测上的精度。 文章的思想比较简单,主要是利用特征金字塔对不同层次的特征进行尺度变换之后,再进行信息融合,从而可以提取到比较低层的信息,也就是相对顶层特征来说更加详细的信息。顶层特征在不断卷积的过程中可能忽略了小物体的一些信息,特征金字塔通过不同层次的特...原创 2018-12-12 10:45:11 · 3720 阅读 · 0 评论 -
【目标检测】对RCNN论文的一些理解
RCNN可谓是深度学习应用目标检测的开山之作,RCNN提出之前,目标检测往往用传统的HOG、SIFT等方法提取特征,RBG大神认为CNN既然在图片分类产生了巨大作用,为何不能用来提特征呢?于是RCNN就诞生了。 在设计神经网络应用目标检测的时候,首先我们可能考虑将其作为一个regression问题,也就是通过滑动窗口在一张图片上不断滑动,网络学习出窗窗是不是有物体,并且不断修正objec...原创 2018-12-09 12:57:23 · 200 阅读 · 0 评论 -
【目标检测】对YOLOv1 论文的一些理解
YOLOv1 是这周看的跟目标检测相关的第5篇paper,在了解了rcnn系列paper的work原理之后,YOLO还是有很大不同的,rcnn系列的论文要么通过ss方法要么通过RPN 产生bounding box,对每个产生的bounding box进行分类检测,而YOLO则从全局的角度出发,将ob任务当作一个regression任务,一次输入图片直接产生图片中bounding box的 c...原创 2018-12-08 11:58:15 · 969 阅读 · 0 评论 -
softmax
1. 什么是SoftmaxSoftmax 在机器学习和深度学习中有着非常广泛的应用。尤其在处理多分类(C > 2)问题,分类器最后的输出单元需要Softmax 函数进行数值处理。关于Softmax 函数的定义如下所示:其中,Vi 是分类器前级输出单元的输出。i 表示类别索引,总的类别个数为 C。Si 表示的是当前元素的指数与所有元素指数和的比值。Softmax 将多分类的输出数值...原创 2018-11-23 11:22:31 · 244 阅读 · 0 评论 -
CS231n-KNN实现(附坑)
从效果看来,KNN并不适合图像识别,它的识别更多基于背景,而不是图片的语义主体。所以在实际应用中我们一般不适用KNN识别图像,但是在学习过程中,通过KNN算法我们可以学习到图像识别的整个流程,还是有些许帮助的图像识别流程无论是哪种分类算法,图像识别的流程主要为以下流程输入图像:一般来说,输入的是图像的像素值训练模型:通过输入的图像来训练模型评价模型:用测试数据来测试模型的分类能力从而...原创 2018-11-21 21:44:54 · 687 阅读 · 0 评论