计算机视觉
文章平均质量分 75
无止境x
现为中科院工程师,更多内容关注微信公众号《科学无止境》。
研究生期间的算法工程师,毕业后进入中科院从事科学装置和系统的研究,分享AI和云计算领域的内容,一个有点自己想法的IT从业者,欢迎关注交流!
展开
-
plt.scatter散点图
函数的原型:matplotlib.pyplot.scatter(x,y,s=None,c=None,marker=None,cmap=None,norm=None,vmin=None,vmax=None,alpha=None,linewidths=None,verts=None,edgecolors=None,*,data=None,**kwargs)参数的解释:x,y:表示的是大小为(n,)的数组,也就是我们即将绘制散点图的数据点s:是一个实数或者是一个数...原创 2021-02-19 12:07:21 · 2648 阅读 · 0 评论 -
遥感图像处理流程
一.预处理1.降噪处理由于传感器的因素,一些获取的遥感图像中,会出现周期性的噪声,我们必须对其进行消除或减弱方可使用。(1)除周期性噪声和尖锐性噪声周期性噪声一般重叠在原图像上,成为周期性的干涉图形,具有不同的幅度、频率、和相位。它形成一系列的尖峰或者亮斑,代表在某些空间频率位置最为突出。一般可以用带通或者槽形滤波的方法来消除。消除尖峰噪声,特别是与扫描方向不平行的,一般用傅立叶变换进行滤波处理的方法比较方便。 图1 消除噪声前 ...转载 2020-11-09 11:32:00 · 5411 阅读 · 2 评论 -
COCO数据集概述
COCO数据集概述COCO的全称是Common Objects in Context,是微软团队提供的一个可以用来进行图像识别的数据集。MS COCO数据集中的图像分为训练、验证和测试集。其行业地位就不再多少了,本文主要梳理一下该数据集包含的内容。下图是官网给出的可下载的数据集(更新时间2020年01月09日),从这里可看出其数据集主要包括有标注的和无标注的数据:2014:训练集 + 验证集 + 测试集 2015:测试集 2017:训练集 + 验证集 + 测试集PK的内容包括:目标检测与转载 2020-11-01 22:14:18 · 3207 阅读 · 1 评论 -
VOC数据集
概述Pascal VOC2012作为基准数据之一,在对象检测、图像分割网络对比实验与模型效果评估中被频频使用,但是如果没有制作过此格式的数据集就会忽略很多细节问题,今天我们一起来从头到尾扒一扒Pascal VOC2012 数据集各种细节问题。Pascal VOC2012数据集主要是针对视觉任务中监督学习提供标签数据,它有二十个类别:Person:personAnimal:bird, cat, cow, dog, horse, sheepVehicle:aeroplane, bicy.转载 2020-11-01 20:05:14 · 3611 阅读 · 1 评论 -
视觉注意力机制 | Non-local模块与Self-attention的之间的关系与区别?
什么是视觉中的注意力机制?计算机视觉(computer vision)中的注意力机制(attention)的基本思想就是想让系统学会注意力——能够忽略无关信息而关注重点信息。近几年来,深度学习与视觉注意力机制结合的研究工作,大多数是集中于使用掩码(mask)来形成注意力机制。掩码的原理在于通过另一层新的权重,将图片数据中关键的特征标识出来,通过学习训练,让深度神经网络学到每一张新图片中需要关注的区域,也就形成了注意力。注意力机制一种是软注意力(soft attention),另一种则是强注意力(转载 2020-09-23 15:54:41 · 2174 阅读 · 1 评论 -
人脸算法系列:MTCNN人脸检测详解
本文的内容预览人脸检测的概念人脸检测是一种在多种应用中使用的计算机技术,可以识别数字图像中的人脸。人脸检测还指人类在视觉场景中定位人脸的过程。人脸检测可以视为目标检测的一种特殊情况。在目标检测中,任务是查找图像中给定类的所有对象的位置和大小。例如行人和汽车。人脸检测示例在人脸检测中应用较广的算法就是MTCNN( Multi-task Cascaded Convolutional Networks的缩写)。MTCNN算法是一种基于深度学习...转载 2020-08-10 21:21:53 · 892 阅读 · 0 评论 -
医学图像处理最全综述
目录0、引言1、病变检测2、图像分割基于深度学习的医学图像分割与检测3、图像配准图像配准的定义4、图像融合5、预测与挑战6、结论参考文献0、引言医学图像处理的对象是各种不同成像机理的医学影像,临床广泛使用的医学成像种类主要有X-射线成像 (X-CT)、核磁共振成像(MRI)、核医学成像(NMI)、超声波成像(UI)四类。在目前的影像医疗诊断中,主要是通过观察一组二维切片图象去发现病变体,这往往需要借助医生的经验来判定。利用计算机图像处理技术对二维切片图象进行.转载 2020-08-06 20:15:47 · 16810 阅读 · 1 评论 -
目标检测常用损失函数-类别损失+位置损失
目录类别损失1. 交叉熵损失 Cross Entropy Loss2. Focal Loss 改进的交叉熵损失函数位置损失1. L1 Loss平均绝对误差(Mean Absolute Error, MAE)2. L2 Loss均方误差损失(Mean Square Error, MSE)3. Smooth L1 Loss4. IoU Loss5. GIoU Loss6. DIoU Loss. CIoU Loss一般的目标检测模型包含两类损失函数,一...转载 2020-07-26 11:45:52 · 12803 阅读 · 0 评论 -
目标检测最全综述
前言图片分类任务我们已经熟悉了,就是算法对其中的对象进行分类。而今天我们要了解构建神经网络的另一个问题,即目标检测问题。这意味着,我们不仅要用算法判断图片中是不是一辆汽车, 还要在图片中标记出它的位置, 用边框或红色方框把汽车圈起来, 这就是目标检测问题。 其中“定位”的意思是判断汽车在图片中的具体位置。近几年来,目标检测算法取得了很大的突破。比较流行的算法可以分为两类,一类是基于Region Proposal的R-CNN系算法(R-CNN,Fast R-CNN, Faster R-CNN等),它转载 2020-07-24 00:54:51 · 6168 阅读 · 0 评论 -
目标检测之 IoU
IoU 作为目标检测算法性能 mAP 计算的一个非常重要的函数。但纵观 IoU 计算的介绍知识,都是直接给出代码,给出计算方法,没有人彻底地分析过其中的逻辑,故本人书写该篇博客来介绍下其中的逻辑。1. IoU的简介及原理解析IoU 的全称为交并比(Intersection over Union),通过这个名称我们大概可以猜到 IoU 的计算方法。IoU 计算的是 “预测的边框” 和 “真实的边框” 的交集和并集的比值。开始计算之前,我们首先进行分析下交集和并集到底应该怎么计算:我们首先转载 2020-07-06 10:50:26 · 222 阅读 · 0 评论 -
三、训练自己的yolo3模型
yolo3整体的文件夹构架如下:本文使用VOC格式进行训练。训练前将 标签文件(.xml) 放在 VOCdevkit 文件夹下的 VOC2007 文件夹下的 Annotation 中。训练前将图片文件放在 VOCdevkit 文件夹下的 VOC2007 文件夹下的 JPEGImages 中。一个图片文件 对应 一个标签文件:在训练前利用 voc2yolo3.py 文件生成对应的txt。再运行根目录下的voc_annotation.py,运行前需要将classes改成你自己的cla..原创 2020-07-05 16:17:49 · 406 阅读 · 0 评论 -
二、YOLOv3-训练部分
二、训练部分1、计算loss所需参数在计算loss的时候,实际上是y_pre和y_true之间的对比:y_pre 就是一幅图像经过网络之后的输出,内部含有三个特征层的内容;其需要解码才能够在图上作画y_true 就是一个真实图像中,它的每个真实框对应的(13,13)、(26,26)、(52,52)网格上的偏移位置、长宽与种类。其仍需要编码才能与y_pred的结构一致y_true 是最理想的y_pre 实际上y_pre和y_true内容的shape都是(batch_size,13,13,3,原创 2020-07-05 11:36:38 · 498 阅读 · 0 评论 -
目标检测 (Object Detection) (一): 评估标准 (mAP,IOU,NMS,FPS)
目标检测算法(一):评估标准目标检测是计算机视觉领域的基本且重要的问题之一。一般目标检测(generic object detection)的目标是根据大量预定义的类别在自然图像中确定目标实例的位置与类别。本文主要介绍目标检测的评估标准。常用的目标检测的评估标准包括:平均精度均值mAP(mean average precision)、交并比IoU(Intersection over Union)、非极大值抑制NMS(Non-Maximum suppression);每秒帧率FPS (Frame Per转载 2020-06-03 16:40:08 · 3017 阅读 · 2 评论 -
YOLOv4来了!COCO 43.5 AP,65FPS!实现速度与精度的最优平衡
今年初YOLO 之父Joseph Redmon宣布推出CV界,引起轩然大波,大家纷纷猜测YOLO是否不会再出v4版,退出历史舞台。今天,YOLOv4重磅发布,作者为俄罗斯开发者 Alexey Bochkovskiy 和两位中国台湾开发者 Chien-Yao Wang、Hong-Yuan Mark Liao。YOLOv4 没有理论创新,而是在原有YOLO目标检测架构的基础上增加了近年CNN改进的众多技术,从数据处理到网络训练再到损失函数,遵行“拿来主义”,加上漂亮的工程实践,打造实现最..转载 2020-06-01 18:11:44 · 3187 阅读 · 0 评论 -
目标检测中的AP,mAP
AP (Average precision 平均精度)是主流的目标检测模型的评价指标。再介绍AP之前,我们先来回顾一下需要用到的几个概念precision,recall以及IoU。IoU(Intersection over union)交并比交并比(IoU)衡量的是两个区域的重叠程度,是两个区域重叠部分面积占二者总面积(重叠部分只计算一次)的比例。如下图,两个矩形框的IoU是交叉面积(中间图片红色部分)与合并面积(右图红色部分)面积之比。交并比(Iou)的定义:在目标检测任务中,如果转载 2020-06-01 16:56:36 · 1264 阅读 · 0 评论 -
YOLOv4 的各种新实现、配置、测试、训练资源汇总
近日最火的莫过于 YOLOv4 的横空出世,CV君在第一时间进行了 YOLOv4的论文解读:YOLOv4来了!COCO 43.5 AP,65FPS!实现速度与精度的最优平衡得到了大家的广泛关注。以下视频为 YOLOv4 在驾驶环境的测试结果:观看地址:https://mp.weixin.qq.com/s/B4aTgmbLmYaa2-zxncF-xg来自https://www.youtube.com/watch?v=VK2XnppfD_o生成上述视频的命令:./darkn..转载 2020-05-31 18:11:59 · 932 阅读 · 0 评论 -
三维重建-双目立体视觉原理
前言三维重建是个跨多学科的应用领域,围绕不同的尺度大小、不同速度要求、不同精度要求、不同硬件成本等要求发展出了各种各样的技术方案。在这个应用领域,充分体现了,没有最好的设备,只有最合适的方案。在本系列文章中,我尝试解释接触过的不同技术方案,如有错误之处,敬请斧正。双目立体视觉原理视差(Disparity) 及 深度计算人依靠两只眼睛判断深度(物体离眼睛的距离),具体是如何来...转载 2019-12-11 16:12:13 · 3997 阅读 · 0 评论 -
ICCV2019 全部论文分类汇总(含目标检测 / 图像分割等,1008 更新中)
作为计算机视觉领域三大顶会之一,ICCV2019目前已公布了所有接收论文ID(会议接收论文1077篇,总提交4303篇,25%的接收率),相关报道:1077篇!ICCV2019接收结果公布,你中了吗?此前我们也对CVPR2019的论文做了分类汇总:CVPR2019 | 论文分类汇总,而本帖是对ICCV2019顶会论文的实时跟进和分类,欢迎点击文末关注按钮,即可获取本帖最新更新消息。IC...转载 2019-12-09 20:03:43 · 8802 阅读 · 0 评论 -
用深度学习玩图像的七重关卡
用深度学习玩图像的七重关卡第一个重境界: 图像识别如果你开始了解深度学习的图像处理, 你接触的第一个任务一定是图像识别 :比如把你的爱猫输入到一个普通的CNN网络里, 看看它是喵咪还是狗狗。一个最普通的CNN, 比如像这样几层的CNN鼻祖Lenet, 如果你有不错的数据集(比如kaggle猫狗大战)都可以给出一个还差强人意的分类结果(80%多准确率), 虽然...转载 2019-04-14 17:30:39 · 299 阅读 · 0 评论 -
将改变你对世界的看法的5种计算机视觉技术
编者按目前,计算机视觉是深度学习领域最热门的研究领域之一。计算机视觉实际上是一个跨领域的交叉学科,包括计算机科学(图形、算法、理论、系统、体系结构),数学(信息检索、机器学习),工程学(机器人、语音、自然语言处理、图像处理),物理学(光学 ),生物学(神经科学)和心理学(认知科学)等等。许多科学家认为,计算机视觉为人工智能的发展开拓了道路。那么什么是计算机视觉呢? 这里给出了几个比较严谨的...翻译 2019-04-14 16:07:17 · 376 阅读 · 0 评论