![](https://img-blog.csdnimg.cn/20201014180756926.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
计算机视觉
小趴菜也想当卷王
目前博士在读,研究方向为目标检测以及目标检测在植物疾病检测的应用。硕士研究行为识别与医学图像处理。欢迎各位学者大胆交流。
展开
-
损失函数是如何设计出来的
Loss函数如何理解原创 2022-12-08 13:49:57 · 1007 阅读 · 1 评论 -
一些优质的学习资料
一些学习资料,便于广泛的学习原创 2022-06-12 13:40:22 · 134 阅读 · 0 评论 -
Yolo算法--从原理到实现(二)
YOLO 训练自己的数据-darknet的实现安装darknet darknet官网都有很详细的步骤:https://pjreddie.com/darknet/yolov2/如果你用的是ubuntu,可以打开终端,在终端输入以下几行代码。我自己是在ubuntu上进行的。第一行是下载darknet的包,解释一下,用darknet训练的好处就在于,你不需要过多的操心网络的结构,损失函数,等...原创 2018-12-07 23:07:53 · 2887 阅读 · 0 评论 -
Yolo算法--从原理到实现(一)
YOLO算法:从v1到v3yolo是目前比较流行的目标检测算法,速度快结构简单。其他的目标检测算法也有RCNN,faster-RCNN, SSD等。近几年来,目标检测算法取得了很大的突破。比较流行的算法可以分为两类,一类是基于Region Proposal的R-CNN系算法(R-CNN,Fast R-CNN, Faster R-CNN),它们是two-stage的,需要先使用启发式方法(s...原创 2018-12-06 22:38:41 · 34194 阅读 · 5 评论 -
目标检测算法
目标检测算法一般分为两阶段检测和单阶段检测,常见的两阶段的检测方法有滑动窗口、R-CNN系列,SPPNET等,单阶段检测器有YOLO/SSD/Retinanet等,之后将逐一介绍这些算法的核心思想和贡献。2012年之前,大部分的研究人员一直都在用传统的算法进行目标检测,大多是基于SIFT、HOG特征提取,然后送入分类器。比如滑动窗口的方法。滑动窗口将不同大小的窗口以不同的步长遍历图片每一个角落...原创 2019-01-18 22:27:40 · 2959 阅读 · 0 评论 -
滑动平均模型
指数加权平均算法的原理在书上看到了滑动平均模型,不懂什么意思,然后博客上有一篇写的很明白,摘抄了一段,然后附上书中的代码。TensorFlow中的滑动平均模型使用的是滑动平均(Moving Average)算法,又称为指数加权移动平均算法(exponenentially weighted average),这也是ExponentialMovingAverage()函数的名称由来。先来看...原创 2019-03-01 10:23:39 · 10440 阅读 · 4 评论 -
RANSAC初识
RANSAC算法:随机抽样一致算法(random sample consensus,RANSAC)一个简单的例子是从一组观测数据中找出合适的二维直线。假设观测数据中包含局内点和局外点,其中局内点近似的被直线所通过,而局外点远离于直线。简单的最小二乘法不能找到适应于局内点的直线,原因是最小二乘法尽量去适应包括局外点在内的所有点。相反,RANSAC能得出一个仅仅用局内点计算出模型,并且概率还足够高...原创 2018-11-20 10:41:26 · 446 阅读 · 2 评论 -
COCO数据集80个类的实例数量
COCO数据集每个类别的实例数量原创 2022-11-20 15:04:40 · 792 阅读 · 1 评论 -
PASCAL VOC数据集格式文件夹下文件配置
pascal voc文件夹下文件配置原创 2022-08-31 10:11:15 · 494 阅读 · 0 评论 -
计算机视觉中的半监督学习方法
最近在学习半监督学习的知识。找到了一篇博文写的非常好,比较适合入门,我这里说的入门是指有一定深度学习基础,但没有接触过半监督学习领域的人员。如果从未接触过深度学习,建议从基础的神经网络和目标检测算法开始学起。这是一篇英文博文。原文链接如下:https://amitness.com/2020/07/semi-supervised-learning/#1-self-training对应的中文翻译链接如下:https://blog.csdn.net/weixin_42137700/article/deta原创 2022-01-12 17:44:14 · 1562 阅读 · 1 评论 -
yolov5训练自己的数据集
在github上找到了非常良心的一个中文复现yolov5的链接。https://github.com/DataXujing/YOLO-v5这个是官方发布的链接:https://github.com/ultralytics/yolov5本想用yolor训练自己的数据集,因为比较着急,不熟悉docker,因此使用了yolo5替代。由于已经有了VOC格式的数据集,所以很快就复现了这个代码。现在记录一下过程和遇到的问题。1 配置环境这个链接和官方发布的版本基本是一样的。因此我按照官网陈述的环境进行配置原创 2022-01-09 16:24:10 · 598 阅读 · 0 评论 -
目标检测的boundingbox的几种表示方法
目标检测中bounding box的几种表示形式1.xyxy型(x_min,y_min,x_max,y_max)——VOC边框表示法用多个.xml文件存放2.tlwh型(x_min,y_min,width,height)——coco边框表示法用一个.json文件存放3.xywh型(x_center,y_center,width,height)——yolo边框表示法用多个.txt文件存放还有一种是标注多个json文件的,具体我忘记了。用不同网络训练自己的数据时,需要将数据转换成网络能够处原创 2022-01-07 14:16:37 · 3274 阅读 · 0 评论 -
图像文件与标注文件一一配对
情况:使用labelimg标注文档后,获得了大量的图片数据和标注数据。且图像名称与标注名称相同,只是后缀不同。但中间经过一些不为人所知的事情发生后,有些图像数据缺失了标注数据,有些标注数据对应的图像数据找不到了。我们需要对图像文件与标注文件1:1的关系配对。该代码写的时候,具体情况是图像数据有4000张,标注数据有6000张,且4000张图像数据均有标签。因此我直接用了图像的文件名进行匹配。删除了多余的标签。import osfrom shutil import copyimage_path =原创 2021-12-01 09:14:56 · 909 阅读 · 1 评论 -
随机分配训练集测试集和验证集
这个代码更加适用于,一张图片对应一个标注文件的数据集。通过随机分配之后,将全部文件分为train、test、val以及对应的标注数据也会分开。如果您只有图像没有标注数据,那就更容易实现。本文就不再赘述。下面是代码,核心部分就是使用了一次随机排序。import os # os是用来切换路径和创建文件夹的。import randomfrom shutil import copy # shutil 是用来复制黏贴文件的# "blossom_end_rot", "graymold", "powde原创 2021-12-01 09:02:18 · 1217 阅读 · 0 评论 -
可视化bounding-box
图像标注文件以xml文件保存下来。xml文件是个啥我就不多做解释了。现在要解决的问题是如何可视化xml文件到对应图像上。下面是代码实现。注释相信已经解释清楚了。jpg和png的代码是通用的。我使用了条件语句。如果您的格式不是png或jpg而是jpeg等结尾的文件,那么您自行修改。这是可视化后的图片。字体和框的尺寸您可以自行修改即可。import xml.etree.ElementTree as ETimport cv2import osxml_path = '/Users/Dong/De原创 2021-12-01 08:46:42 · 602 阅读 · 0 评论 -
Mac系统隐藏文件导致处理文件失败。
MacBook,Mac OS 系统经常出现点开头的隐藏文件。以至于遍历系统文件,比如处理图像时报错,说无法处理,无效文件等错误。建议使用Mac批量处理文件时,首先使用终端命令 ls -a 检查该路径下是否有.开头的隐藏文件。该文件经常在复制文件或者编辑文件之后产生。因此,在最后遍历文件之前,最好检查。删去即可。Mac OS上使用Python3读取文件过程中出现了UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0x80 in position 313原创 2021-12-01 08:17:03 · 475 阅读 · 0 评论 -
图像特征检测中的SIFT等算子
SIFT特征点提取和匹配尺度不变特征转换即SIFT (Scale-invariant feature transform)是一种计算机视觉的算法。它用来侦测与描述影像中的局部性特征,它在空间尺度中寻找极值点,并提取出其位置、尺度、旋转不变量。因为当看到这些个不变量的时候,感觉云里雾里的,并不理解到底什么是不变量,所以首先来解释一下上面的这些不变量到底是什么:同一物体不同图像间只差一个旋转、...原创 2018-12-04 22:12:07 · 920 阅读 · 0 评论 -
自编码器AutoEncoder(二)
那么既然编码器可以将784维的数据压缩到128维,把原数据的精髓提取到128维的空间中,而且自编码有点类似于PCA的做法,那么既然可以压缩,我把它压缩到二维或者三维空间可视化一下可不可以呢?答案是可以的。当把数据不断地压缩,然后解码,然后跟原始数据对比求出残差再反向传递,逐步减小损失的过程中,自编码器学到的东西会越来越好,压缩的精髓也就越来越能代表原始数据的分布,那么我就把原始数据压缩到2维或者3...原创 2018-12-12 21:34:03 · 666 阅读 · 0 评论 -
自编码器AutoEncoder(一)
自编码器AutoEncoder我们先构架一个神经网络模型,这个模型是收集一张图片,接受这个图片后,神经网络给这个图片压缩,最后再从压缩的图片中还原,是不是感觉有点抽象,其实我也觉得这样的解释不太恰当,那就让我们更加的具体一点来深入了解下这个自编码。现在假设我们刚才构建的模型是这个样子,我们可以从图片中看出来,我们刚才上传给自编码模型的图片实质上是经过压缩以后再进行解压的一个过程。...原创 2018-12-11 14:36:19 · 1088 阅读 · 0 评论 -
卷积神经网络与深度学习基础
发现了几篇写的比较好的文章,以后有类似的好文章直接吧网址粘贴这篇博客里面。卷积神经网络:https://mp.weixin.qq.com/s/287vamTc6QD4wo6maX0dbQCNN,RNN,前馈神经网络:https://mp.weixin.qq.com/s/2VhQOrZ5G-auQrXbwSLo7A机器学习与深度学习等6门课程吴恩达教学:https://study.163...原创 2019-03-14 21:04:05 · 237 阅读 · 0 评论 -
图卷积的一些想法
图卷积在行为识别领域的三个最主要的思路为:1.如何设计权重分配策略,可以考虑不同的label策略,还可以考虑为每个节点单独学习独立权重。2.如何设计邻接矩阵,可以是根据先验知识来调整邻接矩阵,也可以是让网络自己学习。3.如何将图卷积扩展到时空域。2019年行为识别方向顶会文章:https://blog.csdn.net/qq_36589469/article/details/915...原创 2019-08-06 08:59:47 · 345 阅读 · 0 评论 -
目标检测中的一些feature descriptor
方向梯度直方图(Histogram of Oriented Gradient, HOG)HOG特征是图像处理中物体检测的特征描述子。计算的是图像局部区域的梯度方向直方图来构成特征,因为不同区域的梯度方向是不同的。这些特征结合SVM已经广泛应用于图像识别中。主要思想:梯度或者边缘方向密度能够图像的轮廓信息,而且梯度主要存在于图像中的边缘部分。具体的实现方法是:将图像划分成小的连通域,我们...原创 2018-12-04 22:12:24 · 1633 阅读 · 0 评论