目标检测
文章平均质量分 75
目标检测论文,源码。
jingbo1801
机器视觉、图像,TX2,python,c++
展开
-
yolo目标检测实战
实战教程,持续更新中。原创 2021-06-23 23:04:42 · 1490 阅读 · 4 评论 -
5、从RCNN到FasterRCNN(各模块独立训练到端到端检测框架)
使用训练好的分类网络、SVM分类器,输入一张图,首先SS提取1~2k个候选区域,之后所有候选区域图像进去分类器提取4096维特征,然后SVM判断是否是该类别目标,之后对每个类别NMS,最后使用类别回归器进行位置修正。三种尺度(面积){128^2,256^2,512^2},三种比例{1:1, 1:2, 2:1},每个位置(每个滑动窗口)在原图上都对应有3x3=9个anchor。u对应目标真实类别的标签。金字塔池化层,对输入特征图进行不同规格的池化,然后将输出的特征图拉成向量,固定拼接,形成固定长度的输出。..原创 2022-08-14 17:32:53 · 559 阅读 · 0 评论 -
4、Faster R-CNN(翻译+注释)
本作将引入一个区域推荐网络(RPN)和检测网络共享全图像卷积特征,使得区域推荐的开销几近为0。一个RPN是一个全卷积网络技能预测物体的边框,同时也能对该位置进行物体打分。RPN通过端到端的训练可以产生高质量的推荐区域,然后再用Fast R-CNN进行检测。通过共享卷积特征,我们进一步整合RPN和Fast R-CNN到一个网络,用近期流行的“术语”说,就是一种“注意力”机制。RPN组件会告诉整合网络去看哪个部分。对于非常深的VGG-16模型[3]。...翻译 2022-08-13 19:04:45 · 449 阅读 · 0 评论 -
3、Fast R-CNN(翻译+注释)
本文提出了一个快速的基于区域推荐的卷积网络方法(Fast R-CNN)用于对象检测。Fast R-CNN在前人工作的基础上使用深度卷积网络,可以更有效地分类物体推荐。相比之前的工作,Fast R-CNN进行了多项创新,在提高了检测精度的同时,也提高了训练和测试速度。Fast R-CNN训练了一个超深VGG16网络,训练时间比R-CNN快9倍,测试时间快213倍,在PASCAL VOC2012上达到了更高的mAP。相比SPPnet,Fast R-CNN训练快3倍,测试快10倍,并且更加准确。......翻译 2022-08-13 18:50:49 · 288 阅读 · 0 评论 -
1、目标检测 RCNN(翻译+标注)
但是这里面的样本确定和CNN中的样本也是不一样的啦,因为CNN需要大量的样本去驱动特征提取,因此正样本的阈值比较低。而SVM适合小样本的分类,通过反复的实验,RCNN的SVM训练将ground truth样本作为正样本,而IOU>0.3的样本作为负样本,这样也是SVM困难样本挖掘的方法。RCNN使用的是AlexNet,由于CNN的参数量巨大,训练CNN需要大量的样本,此前的方法是大家先用无监督的预训练初始化CNN的参数,然后再在样本集上使用监督的训练方法。但是训练CNN的样本量还是不能少的,...转载 2022-08-10 21:00:59 · 276 阅读 · 0 评论 -
yolov3 完整讲解-从数据编码角度介绍
对yolo系列文章的发展做个总结。神经网络训练模型的根本就是真值与预测值比较,落实到不同任务最根本的区别的就是对真值的编码。理解深度学习的关键是明白真实值如何编码,下面从这个角度介绍。 深度学习最早用来解决分类问题,对于一个10分类任务,将类别编码为 one-hot 形式。 对于一个分类问题,我们希望输入一张图,输出类别。以四分类的行人、自行车、摩托车、小汽车为例,图像为数字矩阵,所以我们很容易想到对四类别分别用四个数字描述。只管的描述:1、行人;2、自行车;3、摩托车;4、小汽原创 2022-07-09 19:49:23 · 1508 阅读 · 1 评论 -
ubuntu18.04下cpu+darknet+yolov3编译
做个小测试,只需要编译darknet,生成libdarknet.so供调用。1、下载源码git clone https://github.com/AlexeyAB/darknet cd darknet2、设置编译选项配置使用CPU,调用动态库选项。# mkaefile文件节选GPU=0 # 是否使用GPUCUDNN=0 # 是否使用GPUCUDNN_HALF=0 # 是否半精度推理OPENCV=0 # 是否使用OPENCVAVX...原创 2021-12-19 20:25:51 · 2333 阅读 · 0 评论 -
mosaic数据增强
mosaic数据增强则利用了四张图片,对四张图片进行拼接,每一张图片都有其对应的框框,将四张图片拼接之后就获得一张新的图片,同时也获得这张图片对应的框框,然后我们将这样一张新的图片传入到神经网络当中去学习,相当于一下子传入四张图片进行学习了。论文中说这极大丰富了检测物体的背景!且在标准化BN计算的时候一下子会计算四张图片的数据!如下图所示:1、首先随机取四张图片2、分别对四张图片进行数据增广操作,并分别粘贴至与最终输出图像大小相等掩模的对应位置。操作包括:...原创 2021-10-29 19:35:17 · 13442 阅读 · 3 评论 -
评价指标MAP
mAP:mean Average Precision即均值平均精确度,首先是一个类别内,求平均精确度(Average Precision),然后对所有类别的平均精确度再求平均(mean Average Precision)。1、相关知识点1.1、IOU交并比预测的检测框(bbox)和真实的检测框(ground truth)的交集和并集之间的比例。def iou(rec1, rec2): x1,x2,y1,y2 = rec1 #分别是第一个矩形左右...原创 2021-07-18 12:38:24 · 1035 阅读 · 0 评论 -
qt下darknet引用
跟踪makefile,提取接口 引用文件,将makefile中以下几个文件拷贝进调用工程。yolo_console_dll.cpp为动态库调用主函数文件,其中引用yolo_v2_class.hpp。yolo_v2_class.hpp为检测类封装接口类,在yolo_v2_class.cpp中,引用darknet.h动态库头文件。1、include/darknet.hdarknet.h为生成的libdarknet.so动态库对应的头文件。将该文件名...原创 2021-07-14 20:20:30 · 425 阅读 · 0 评论 -
win10显卡驱动+cuda+cudnn安装
验证环境:win10+driver450+cuda11.0+cudnn8.0.51、驱动安装驱动下载地址:https://www.nvidia.cn/Download/index.aspx?lang=cn,选择自己的显卡型号,下载类型选择Studio驱动程序(开发用),之后点击搜索。下载页面中,点击下载即可。为保证运行时版本一致,建议下载450版本。早期版本的下载方式参考:https://blog.csdn.net/weixin_34910922/articl...原创 2021-07-07 21:19:49 · 756 阅读 · 0 评论 -
k-means算法
根据样本间的某种距离或者相似性来定义聚类,即把相似的(或距离近的)样本聚为同一类,而把不相似的(或距离远的)样本归在其他类。基本思想是:通过迭代寻找k个聚类的一种划分方案,使得用这k个聚类的均值来代表相应各类样本时所得的总体误差最小。k-means算法的基础是最小误差平方和准则。其代价函数是:式中,μc(i)表示第i个聚类的均值。我们希望代价函数最小,直观的来说,各类内的样本越相似,其与该类均值间的误差平方越小,对所有类所得到的误差平方求和,即可验...原创 2021-07-06 21:55:21 · 351 阅读 · 3 评论 -
Anchor Boxes
声明:本文引用吴恩达教授的DeepLearning课程内容。使用bounding box对每个格子预测一个目标,可输出目标的大小、位置、置信度及类别信息。但实际中,一个格子上可能落有多个目标需要检出,这就需要使用anchor box这个概念。问题引入:假设你有这样一张图片,对于这个例子,继续使用 3×3 网格,注意行人的中点和汽车的中点几乎在同一个地方,两者都落入到同一个格子中。所以对于那个格子,???? 将无法同时输出人和车的检测结果,只能从两个检测结...原创 2021-06-25 20:47:03 · 375 阅读 · 0 评论 -
目标检测-Bounding Box 预测
声明:本文引用吴恩达教授的DeepLearning课程内容。滑动窗口法的卷积实现虽然效率更高,但仍然存在问题,不能输出最精准的边界框。因为滑动窗口法中,取这些离散的位置集合并不能完全匹配目标大小、位置。其中一个能得到更精准边界框的算法是 YOLO 算法, YOLO(You only look once)意思是你只看一次。比如输入图像是 100×100 的,然后在图像上放一个3×3网格,实际实现时会用更精细的网格,可能是 19×19。基本思路是...原创 2021-06-25 20:41:12 · 1586 阅读 · 3 评论 -
基于滑动窗口的目标检测
声明:本文引用吴恩达教授的DeepLearning课程内容。1、基于滑动窗口的目标检测算法首先固定一个于滑动窗口区域,然后将滑动窗口在图像上按照指定步长进行滑动,对于每一次的滑动得到区域进行预测,判断该区域中存在目标的概率。调整滑动窗口的大小、滑动步长,继续以同样的方式滑动,预测。滑动窗口目标检测算法也有很明显的缺点,就是计算成本,因为你在图片中剪切出太小方块,卷积网络要一个个地处理。如果你选用的步幅很大,显然会减少输入卷积...原创 2021-06-25 20:37:21 · 7052 阅读 · 2 评论 -
目标定位
图像分类:图片分类问题并不陌生,例如,输入一张图片到多层卷积神经网络。这就是卷积神经网络,它会输出一个特征向量,并反馈给 softmax 单元来预测图片类型。目标定位:如果你还想定位图片中汽车的位置,该怎么做呢?我们可以让神经网络多输出几个单元,输出一个边界框。具体说就是让神经网络再多输出 4 个数字,标记为????????,????????,????ℎ和????????,这四个数字是被检测对象的边界框的参数化表示。这有四个分类,神经网络输出的是这四个数字和一个分类标签,或分类标签出现...原创 2021-06-25 20:33:22 · 456 阅读 · 0 评论 -
yolo源码darknet框架ubuntu下编译
测试环境:ubuntu18.04+driver450+cuda11.0+cudnn8.0.5+opencv4.4.01、ubuntu显卡驱动下载安装2、cuda及cudnn安装3、opencv4编译配置4、darknet源码编译测试原创 2021-06-22 21:50:53 · 437 阅读 · 0 评论 -
linux-yolov4 darknet环境配置以及效果实测
目录1、编译运行2、测试运行测试环境:ubuntu18.04+driver450+cuda11.0+cudnn8.0.5+opencv4.4.0工程地址:https://github.com/AlexeyAB/darknet1、编译运行 配置好cuda cudnn 以及opencv后。 进入darknet目录,先修改一下Makefile里面的文件,以支持GPU:GPU=0CUDNN=0CUDNN_HALF=0OPENCV=0AVX=0...原创 2021-06-22 21:42:29 · 1499 阅读 · 2 评论 -
yolov4论文翻译
YOLOv4 Optimal Speed and Accuracy of Object Detection论文下载:https://arxiv.org/pdf/2004.10934.pdf论文源码:https://github.com/AlexeyAB/darknet摘要有大量的特性是可以提高卷积神经网络(CNN)的准确性。需要对大型数据集上此类要素的组合进行实际测试,以得到结果的理论论证。某些特性仅针对特定模型、特定问题,或仅适用于小规模数据集;而某些特性(如批处理规范化和残差连接)适用于原创 2020-06-24 23:46:19 · 1030 阅读 · 0 评论 -
yolov3详解-模型结构
1、配置文件说明以tiny为例。yolo中以配置文件解析的形式生成模型结构。其中:1.1、[net][net]中保存网络配置超参数,如batch、输入大小,训练参数等。# Testingbatch=1subdivisions=1# Training# batch=64# subdivisions=2width=416height=416channels=3mom...原创 2020-05-08 07:35:13 · 5339 阅读 · 1 评论 -
yolo v3 论文翻译-整理
摘要我们推出了YOLO的一些更新!我们做了一篮子微小的设计上的改变来让YOLO变得更好。我们同时也把这个新网络训练得更臃肿了。它虽然比上一版本大了一点,但更加准确。别担心,它依然很快。在320x320的分辨率28.2mAP上YOLOv3跑出了22ms,跟SSD准确率一样但比它快三倍。用的0.5 IOU mAP检测标准来衡量,YOLOv3很好了。在Titan X上它达到了57.9 AP50 推断...原创 2020-05-01 20:34:11 · 632 阅读 · 1 评论 -
yolo v2论文翻译-整理
摘要:我们介绍YOLO9000,一个最先进的,实时目标检测系统,可以检测超过9000个目标类别。首先,我们提出对YOLO检测方法的各种改进方法,包括新颖的和从以前的工作中得出的。改进的模型YOLOv2在如PASCAL VOC和COCO标准检测任务是最先进的。使用一种新颖的多尺度训练方法,相同的YOLOv2模型可以运行在不同的大小的图片上,提供速度和精度之间的轻松权衡。在67 FPS时,...原创 2020-05-01 20:19:06 · 413 阅读 · 0 评论 -
yolo v1论文翻译-整理
You Only Look Once: Unified, Real-Time Object Detection2015年06月Abstract 摘要 本文提出了一种新的物体检测方法YOLO。YOLO之前的物体检测方法主要是通过region proposal产生大量的可能包含待检测物体的 potential bounding box,再用分类器去判断每个 bounding ...原创 2020-05-01 15:46:18 · 603 阅读 · 0 评论