深度学习
文章平均质量分 67
来一包板栗
知乎主页:
https://www.zhihu.com/people/ai-yin-si-tan-lu-dai-ma
展开
-
卡尔曼滤波与目标追踪
先记录以下最近看的几个不错的帖子:卡尔曼滤波分析和推导:https://www.jianshu.com/p/d3b1c3d307e0https://blog.csdn.net/chaosir1991/article/details/106910668https://zhuanlan.zhihu.com/p/36745755MOT论文:原创 2020-12-15 20:13:47 · 421 阅读 · 0 评论 -
几种表面缺陷检测数据集
1、德国DAGM 2007的数据集总共十类图像,有训练集和测试集,几种样例如下:官方网址:https://hci.iwr.uni-heidelberg.de/node/3616网盘下载:链接:https://pan.baidu.com/s/1CHrH1tZ-B6kvi8U7--isaw提取码:47jo2、钢材表面缺陷这个数据集是东北大学一个老师收集的,分为三个数据...原创 2018-12-12 16:23:43 · 52301 阅读 · 159 评论 -
tiny YOLO v3做缺陷检测实战
前言:接触yolo网络是在七月份,当时把yolo检测的论文以及R-CNN系列,SSD等一些论文看了一下,感觉内容很丰富,也尝试了darknet版本的实现,和yolo v3的实现,在网上也有很多关于上面两种的实现,这里就不讲了。九月份用tiny-yolo v3做了一个缺陷检测的实验,效果出乎意料,准确率和召回率“满分”!!过了三个月才想着把以前的实验总结一下,真不应该。下面从头开始说明怎么在自己的数...原创 2018-12-14 21:28:01 · 20368 阅读 · 93 评论 -
深度学习基础--卷积类型
本文主要简单介绍几种常见卷积类型,有错误的地方望指正,喜欢就点赞吧。知乎也是本人:https://zhuanlan.zhihu.com/p/59839551用于回忆和梳理知识,一些原话没有标注引用,望见谅。1、Upsampling(上采样)在FCN、U-net等网络结构中,涉及到上采样。上采样概念:任何可以让图像变成更高分辨率的技术。最简单的方式是重采样和插值:将输入图片进行resca...原创 2019-03-21 22:18:56 · 488 阅读 · 0 评论 -
深度学习基础--分类网络
一、LetNetLetNet网络是CNN网络的鼻祖,定义了CNN的基本部件:卷积层、池化层全连接层等。二、AlexNet主要特点:1、使用ReLU函数作为CNN的激活函数;2、Dropout技术和数据增强技术的使用,防止模型过拟合;3、当时计算性能满足不了网络需求,使用group conv技术;4、基于神经科学中局部神经元活动竞争机制,提出LRN层,类似于在通道...原创 2019-03-21 22:21:27 · 3188 阅读 · 0 评论 -
KNN分类
一、简单的算法说明KNN是机器学习的最经典分类算法之一,其核心原理为:通过度量函数,比如常用的欧氏距离找出训练样本中与待测点距离最近的K个点; 通过K个点的Label标签进行民主投票,从而对待测点样本进行分类。通过对上述两个核心步骤理解,我们可以有一下几点的认识:KNN算法原理极其简单,算法没有显式的训练过程; KNN每一次对待测样本点的分类投票,都会遍历一次所有训练样本,因此时...原创 2018-07-23 15:39:33 · 462 阅读 · 0 评论 -
查准率与查全率
一、理解查准率(precision)& 查全率(recall)我们在平时常用到的模型评估指标是精度(accuracy)和错误率(error rate),错误率是:分类错误的样本数站样本总数的比例,即E=n/m(如果在m个样本中有n个样本分类错误),那么1-a/m就是精度。除此之外,还会有查准率和查全率,下面举例解释。按照周志华《机器学习》中的例子,以西瓜问题为例。错误率:有多少...原创 2018-07-16 16:27:58 · 68876 阅读 · 7 评论 -
卷积自编码器(Convolutional Autoencoder)的一个实验
1、卷积自编码器(CAE)的简单介绍卷积自编码器是自编码器方法的一种延伸,自编码器包括编码和解码,通过将输入的图像进行编码,特征映射到隐层空间,然后解码器对隐层空间的特征进行解码(重建的过程)获得输入的重建样本。自编码一般使用NN网络做编码和解码器,卷积自编码器利用卷积网络对图像特征抽取和表示的优异性能,来代替自编码器的NN网络。当然,很多人也使用MNIST等数据集,使用CAE做图像去噪等...原创 2019-05-09 21:13:56 · 15751 阅读 · 10 评论 -
记录Pytorch的使用和注意的问题
记录学习pytorch的过程,持续更。1、Pytorch中文官方文档Pytorch中文文档 Pytorch中文手册2、关于显存占用,如何衡量、优化问题,参考如下:pytorch 减小显存消耗,优化显存使用,避免out of memory3、pytorch模型提示超出内存cuda runtime error(2): out of memory。解决办法:batch_size太...原创 2019-07-15 11:02:40 · 314 阅读 · 0 评论 -
opencv-python的RGB与BGR互转
一、格式转换opencv读取图片的默认像素排列是BGR,需要转换。PIL库是RGB格式。 caffe底层的图像处理是基于opencv,其使用的颜色通道顺序与也是BGR(Blue-Green-Red),而日常图片存储时颜色通道顺序是RGB。 在Python中,将RGB顺序的图像转成BGR顺序,需要调整channel dimension的各颜色通道顺序。方法1:img = cv2.im...原创 2019-07-21 15:43:04 · 11542 阅读 · 0 评论 -
ValueError: Dimension 0 in both shapes must be equal, but are 1 and ****(YOLO网络检测问题)
yolo网络检测时错误解决,Yolo等网络测试时出现以下错误:错误原因:类别class维度不匹配错误,比如训练时类别是五类,测试的时候不是五类,就会出现这种错误,自己的训练时五类,测试是三类。原因解决:其实自己在编辑model_data下的voc_classes.txt时,使用的是txt编辑的,没有使用Notepad++,导致txt文档中编辑的三类,其实中间有空字符串,在yolo中的t...原创 2018-11-14 16:04:56 · 14077 阅读 · 14 评论 -
labelImg的安装和使用
使用yolo等框架做目标检测都会需要一些图像标注的工具,这里详细介绍一下labeling的安装和简单的使用。1、安装1.从labeling 的github下载该文件,下图。github链接:https://github.com/tzutalin/labelImg2.解压到随便一个盘下或者桌面。开始配置环境, 这里有两种方法环境配置:第一使用Anocanda,在Anocanda环...原创 2018-11-15 16:46:33 · 14303 阅读 · 8 评论 -
上采样,反卷积,上池化概念区别
通过卷积和池化等技术可以将图像进行降维,因此,一些研究人员也想办法恢复原分辨率大小的图像,特别是在语义分割领域应用很成熟。通过对一些资料的学习,简单的整理下三种恢复方法,并进行对比。1、Upsampling(上采样)在FCN、U-net等网络结构中,涉及到了上采样。上采样概念:上采样指的是任何可以让图像变成更高分辨率的技术。最简单的方式是重采样和插值:将输入图片进行rescale到一个想要...原创 2018-10-08 20:49:37 · 18850 阅读 · 4 评论 -
详细学习1*1卷积核
1*1卷积是大小为1*1的滤波器做卷积操作,不同于2*2、3*3等filter,没有考虑在前一特征层局部信息之间的关系。我们从1*1卷积的两个主要使用来理解其原理和作用。卷积核:可以看作对某个局部的加权求和,它是对应局部感知,它的原理是在观察某个物体时我们既不能观察每个像素也不能一次观察整体,而是先从局部开始认识,这就对应了卷积。卷积核的大小一般有1x1,3x3和5x5的尺寸。卷积核的个数就...原创 2018-10-08 18:02:50 · 27259 阅读 · 12 评论 -
深度学习之图像的数据增强
本文转载自:http://www.cnblogs.com/gongxijun/p/6117588.html在图像的深度学习中,为了丰富图像训练集,更好的提取图像特征,泛化模型(防止模型过拟合),一般都会对数据图像进行数据增强,数据增强,常用的方式,就是:旋转图像,剪切图像,改变图像色差,扭曲图像特征,改变图像尺寸大小,增强图像噪音(一般使用高斯噪音,盐椒噪音)等。但是需要注意,不要加入其他图像...转载 2018-09-21 16:54:16 · 517 阅读 · 0 评论 -
编译yolo-mark时 error C4996解决
前两天在编译并测试yolo的源代码,效果还可以,打算借用这个方法测试自己的图库。需要用到图像标注工具,就使用了yolo-mark,使用说明很简单,在编译darknet时已经配置好了VS2015+opencv3.2的环境,直接编译就行。一开始就报错,如下:1>d:\opencv\build\include\opencv2\flann\logger.h(66): error C4996:...原创 2018-08-18 20:33:17 · 457 阅读 · 0 评论 -
yolo v3 实现
环境:Windows7+vs2015+opencv3.2 显卡:GTX 750 Ti 建议大家配置的过程中,一定要根据YOLO官方配置要求和步骤来,链接:https://github.com/AlexeyAB/darknet#how-to-use自己的电脑以前环境是VS2015+opencv2.4.13,非要头硬强行改成VS2015+opencv3.2,VS配置好环境后,继承的值很难修改...原创 2018-08-17 21:52:05 · 1773 阅读 · 0 评论 -
目标检测——概述
学习视觉与深度学习有一年了,想把以前看到的文章和资料整理一下,不知道从哪些开始,这个暑假,趁着刚刚开完题,稍微闲一些,把目标检测相关的经典论文逐一记录一下,有时间跑一下作者的原码,水平有限,如涉及的内容有误,恳请大家指出。前言计算机视觉领域最基本的三个任务是:分类、目标定位、目标检测。分类的目标是要识别出给出一张图像是什么类别标签(在训练集中的所有类别标签中,给出的这张图属于那类标签的可能...原创 2018-07-08 15:34:15 · 1757 阅读 · 0 评论