![](https://img-blog.csdnimg.cn/20200324210151409.jpg?x-oss-process=image/resize,m_fixed,h_224,w_224)
深度学习
机器学习与深度学习等
南洲.
写以致用,学以致深
展开
-
目标检测中的AP和mAP计算方法(易理解版)
图像分类任务通常用accuracy来衡量模型的准确率,对于目标检测任务,比如测试集上的所有图片一共有1000个object(这里的object不是图片的数量,因为一张图片中可能包含若干个object),两个模型都正确检测出了900个object(IOU>规定的阈值)。与图像分类任务不同的是,目标检测因为可能出现重复检测...转载 2020-04-29 14:36:41 · 8892 阅读 · 14 评论 -
yolov3-tiny 完整训练自己的数据集步骤(数据准备、模型训练和测试、计算mAP和recall)
最近项目需要要进行yolov3-tiny训练自己的数据,参考了一些网上的方法和自己以前做faster-rcnn的经验,总结了自己步骤,以供学习。本文前提是已经编译过opencv源码,安装好cuda和cudnn等,我的博客中有编译和安装参考。 &...原创 2020-03-26 10:47:06 · 15868 阅读 · 24 评论 -
深度学习面试题合集
1、不容错过的12个深度学习面试问题https://ai.51cto.com/art/202001/609327.htm2、深度学习面试题总结1-20https://blog.csdn.net/weixin_42073654/article/details/830635513、深度学习面试及答案https://cloud.tencent.com/developer/article/152...原创 2020-03-10 08:55:39 · 926 阅读 · 0 评论 -
IOU计算
在目标检测中我们有一个基本的操作,形象表述就是画框框,我们要通过我们画的框把我们要标注的目标给框出来,如下面那个狗。我们既可以说这个狗被框出来了,但是也可以说没有,因为你可以观察到左边和上面是存在一些缝隙的。  ...转载 2019-08-28 11:28:06 · 246 阅读 · 0 评论 -
吴恩达深度学习视频及笔记(转)
最近在学习吴恩达深度学习,视频及笔记链接地址记录于此,方便后续学习。吴恩达深度学习视频来自于黄海广博士,链接为:https://zhuanlan.zhihu.com/p/84816512黄海广博士等人翻译的吴恩达深度学习课程,链接为:http://www.ai-start.com/dl...原创 2020-02-12 14:26:07 · 290 阅读 · 0 评论 -
卷积神经网络(CNN)详解
一、卷积神经网络的基本概念卷积神经网络与普通神经网络的区别在于,卷积神经网络包含了一个由卷积层和子采样层(池化层)构成的特征抽取器。在卷积神经网络的卷积层中,一个神经元只与部分邻层神经元连接。在CNN的一个卷积层中,通常包含若干个特征图(featureMap),每个特征图由一些矩形排列的的神经元组成,同一特征图的神经元共享权值,这里共享的权值就是卷积核。卷积核一般以随机小数矩阵的形式初始化,在网...转载 2019-11-21 23:12:06 · 2389 阅读 · 1 评论 -
从YOLOv1到YOLOv3,目标检测的进化之路
引言:如今基于深度学习的目标检测已经逐渐成为自动驾驶,视频监控,机械加工,智能机器人等领域的核心技术,而现存的大多数精度高的目标检测算法,速度较慢,无法适应工业界对于目标检测实时性的需求,这时YOLO算法横空出世,以近乎极致的速度和出色的准确度赢得了大家的一致好评。基于此,我们选择YOLO算法来实现目标检测。YOLO算法目前...转载 2019-11-13 10:01:17 · 470 阅读 · 0 评论 -
对训练图片中小目标进行提取扩展并改写xml中bndbox的坐标值
本文对小物体(在原图占比较小的),例如长宽都小于416的物体进行单独拿出来保存,并生大小为416×416的图片和一个只含有一个object的xml,如果检测的物体长宽都大于416,暂时舍弃。其中的"000000.xml"是随便一个xml,保证只含有一个object就可以,用于复制。img_path ,xml_path,spli...原创 2019-11-07 14:38:45 · 1368 阅读 · 1 评论 -
简单的在线人脸检测实现
1、概述 最近看到一个很简洁的人脸检测代码(https://blog.csdn.net/fendouaini/article/details/102454320),很感兴趣,想尝试是不是可以在线对人脸检测并对人数统计,比如在商场的出入口,学校的出入口等,因为我本身对人脸检测研究少,但知道有很多人脸检测方法。写这个博客是为了记录...原创 2019-10-18 17:40:23 · 592 阅读 · 0 评论 -
批量图片验证模型错误: OP_REQUIRES failed at save_restore_v2_ops.cc:184 : Not found: Key conv1_1/bias not found
最近测试alexnet模型时,模型训练及测试代码:https://github.com/stephen-v/tensorflow_alexnet_classify。想对多个图片进行检测,但是模型在计算出第一个图片时,第二个就会出错,并且报错:OP_REQUIRES failed at save_restore_v2_ops...原创 2019-09-26 18:49:07 · 6560 阅读 · 4 评论 -
将机器学习模型转换成Java、C等
m2cgen (Model 2 Code Generator) - is a lightweight library which provides an easy way to transpile trained statistical models into a native code (Python, C, Java, Go).InstallationSupported Languages...转载 2019-07-10 22:19:42 · 1405 阅读 · 0 评论 -
深度学习中图像预处理为什么要减去图像均值
在深度学习中,大家都会发现训练集,验证集合测试集划分好之后会有减去均值的一步操作,但很多人都是只跟着做,并没有探究为什么要做这一步处理。其主要原理是我们默认自然图像是一类平稳的数据分布(即数据每一维的统计都服从相同分布),此时,在每个样本上减去数据的统计平均值可以移除共同的部分,凸显个体差异。其效果如下所示:  ...转载 2019-09-23 14:54:25 · 2537 阅读 · 0 评论 -
将训练数据的图片和xml文件重新命名
之前对训练的图片和xml文件重新命名为6位数前缀的名称(原始的可能有中文或者不符合使用习惯等),修改后的图片和xml格式如下: &nbs...原创 2019-09-17 16:32:02 · 3563 阅读 · 17 评论 -
Alexnet网络模型介绍
1、概述 AlexNet是2012年ImageNet竞赛冠军获得者Hinton和他的学生Alex Krizhevsky设计的。也是在那年之后,更多的更深的神经网路被提出,比如优秀的vgg,GoogleLeNet。其官方提供的数据模型,准确率达到57.1%,top 1-5 达到80.2%. 这项对于传统的机器学习分类算法而言,已...转载 2019-09-11 16:52:05 · 11116 阅读 · 0 评论 -
LeNet, AlexNet, ZFnet, VGGNet, GoogLeNet, ResNet, DenseNet英文论文链接汇总
简单了解一下卷积神经网络常见架构,如果需要深入学习,还需要看文末的几篇博客或者自己结合论文细读。LeNet这是最早用于数字识别的CNN,标志着CNN的真正面世7层(1Input+3Cov+1FC+1Output)AlexNet网络增大(5Conv+3maxpool+3fc)Data Augmentation:水平翻转、随机裁剪、平移变换、颜色、光照变换;Dropo...原创 2019-09-11 16:02:47 · 1071 阅读 · 0 评论 -
NCNN网络入门及安装
1、概述ncnn 是一个为手机端极致优化的高性能神经网络前向计算框架。ncnn 从设计之初深刻考虑手机端的部署和使用。无第三方依赖,跨平台,手机端 cpu 的速度快于目前所有已知的开源框架。基于 ncnn,开发者能够将深度学习算法轻松移植到手机端高效执行,开发出人工智能 APP,将 AI 带到你的指尖。ncnn 目前已在腾讯多款应用中使用,如QQ,Qzone,微信,天天P图等。NCNN git...转载 2019-09-09 21:26:10 · 1145 阅读 · 0 评论 -
卷积层和池化层中padding参数“SAME”和“VALID”的区别
padding参数的作用是决定在进行卷积或池化操作时,是否对输入的图像矩阵边缘补0,‘SAME’ 为补零,‘VALID’ 则不补,因为在这些操作过程中过滤器可能不能将某个方向上的数据刚好处理完。VALID 模式inputs: 1 2 3 4 5 6 7 8 9 10 11 (12 13) |________________|...原创 2019-09-04 17:20:06 · 5597 阅读 · 1 评论 -
人体姿态估计两种主要思路
人体姿态估计(Human Pose Estimation)也称为人体关键点检测(Human Keypoints Detection)。对于人体姿态估计的研究,主要有两种思路:Top-down 和Bottom-upTop-down方法Top-down首先利用目标检测算法检测出单个人,然后对proposal进行关键点的检测。这种方法一般具有较高的准确率但是处理速度较低。代表性的方法有:(1) S...转载 2019-09-02 20:31:11 · 4621 阅读 · 0 评论 -
tf-pose-estimation 姿态估计实测
在研究行为检测时,对tf-pose-estimation进行了测试,它本身比较轻巧,可以利用CPU进行实时的检测,容易跑通。我在Ubuntu16.04上进行了配置和测试,记录如下:tf-pose-estimation的github地址为:https://github.com/ildoonet/tf-pose-estimationtf-pose-estimation依赖项:python3...原创 2019-09-02 15:04:53 · 6131 阅读 · 13 评论 -
Ubuntu16.04 cuda8.0 caffe编译安装教程
本文参考来源于我的同学tangsh2008有道云笔记:https://note.youdao.com/ynoteshare1/index.html?id=c296693f25868efda80dcc7771558a33&type=note&from=singlemessage#/参考:http://blog.csdn.net/autocyz/article/details/522...转载 2019-07-15 10:13:40 · 593 阅读 · 0 评论 -
根据图片HOG特征,直方图特征,空间关系特征训练SVM模型检测目标(二分类)实例
概述:主要根据图片的HOG特征,直方图特征,空间关系特征进行SVM训练,得到简单的二分类模型,存放于clf_pickle_all_v1.p 中,然后输入单张图片或多个图片进行SVM分类检测,如果是属于某物体,则在图片上画框指示(例如红色),否则画绿色框。代码如下:import numpy as npfrom skimage.feature import hogimport cv2imp...原创 2019-07-11 15:47:23 · 678 阅读 · 5 评论 -
py-faster-rcnn训练自己的数据集遇到问题总结
1.AttributeError: ‘module’ object has no attribute ‘text_format’解决办法:打开py-faster-rcnn/lib/fast_rcnn/train.py增加一行import google.protobuf.text_format 即可解决问题参考:https://blog.csdn.net/qq_33202928/article...原创 2019-07-19 09:37:47 · 621 阅读 · 0 评论 -
使用py-faster-rcnn训练和测试自己的数据集(亲测可训练)
原文来自简书(@运行小爽):https://www.jianshu.com/p/a672f702e596 ,作者写得比较详细了。我自己按这个步骤配置了一遍,可以训练得到结果,因为“简书”有时候图片加载不了,所以自己按自己的步骤重新了一遍,方便阅读;其中有少量相比原文有更改。第一步:制作自己的数据集首先,为了方便,可以将自己的训练图像名称改成PASCAL VOC格式,比如我自己的数据集共有11...转载 2019-07-19 16:19:38 · 5270 阅读 · 6 评论 -
机器学习中常用的超参数调节
网上看了一些机器学习调节参数的方法,此篇比较完善,转载以学习,链接:https://blog.csdn.net/d5224/article/details/72730714转载 2019-07-29 14:06:27 · 1717 阅读 · 0 评论 -
机器学习中参数和超参数的区别
本文参考来源:https://blog.csdn.net/shenxiaoming77/article/details/76849929什么是模型参数?简单来说,模型参数就是模型内部的配置变量,可以用数据估计它的值。具体来讲,模型参数有以下特征:(1)进行模型预测时需要模型参数(2)模型参数值可以定义模型功能(3)模型参数用数据估计或数据学习得到(4)模型参数一般不由实践者手动设...转载 2019-07-29 14:43:45 · 7429 阅读 · 0 评论 -
机器学习知识点梳理总结
概述网上看到了一个对机器学习知识点的总结,是对诸葛越写的“百面机器学习”这本书的总结,基本为知识点总结,没有详细介绍。作者总结的相当好,我也看过此书,因此记录以学习。原文链接:https://blog.csdn.net/xingoo_/article/details/86143546...转载 2019-07-29 15:24:51 · 1926 阅读 · 0 评论 -
超参数调优有哪些方法
概述:为了进行超参数调优,我们一般会采用网格搜索、随机搜索、贝叶斯优化等算法。在具体介绍算法之前,需要明确超参数搜索算法一般包括哪几个要素。一是目标函数,即算法需要最大化/最小化的目标二是搜索范围,一般通过上限和下限来确定;三是算法的其他参数,如搜索步长。1、网格搜索网格搜索可能是最简单、应用最广泛的超参数搜索算法,它通过查找搜索范围内的所有的点来确定最优值。如果采用较大的搜索范围以及较小的...原创 2019-07-29 20:35:40 · 3982 阅读 · 0 评论 -
批量删除LabelImg制作的.xml中的部分的节点值(标签值)
概述自己在用labelImage打好标签后,想只用其中几类训练,不想训练全部类别,又不想重新打标生成.xml文件,因此想到这个办法:直接在.xml文件中删除原有的不需要的标签类及其属性。打标时标签名出现了大小写(工程量大时可能会手滑),程序中有改写标签值为小写的过程,因为我做py-faster-rcnn 训练时,标签必须全部为小写。以如下的.xml文件为例,我故意把标签增加了大写<a...原创 2019-09-06 10:55:50 · 3467 阅读 · 8 评论 -
使用tf-faster-rcnn训练和测试自己的数据集(亲测可训练)
tf-faster-rcnn github地址为:https://github.com/endernewton/tf-faster-rcnn.git自己配置测试过caffe版的的faster-rcnn,后来又测试了tensorflow版的faster-rcnn,配置如下。网上版本也较多,我测试的GPU版的,改动的地方不多。训练模型:1.放入自己的数据集,步骤与py-faster-rcnn一样...原创 2019-07-25 23:46:31 · 1718 阅读 · 13 评论 -
tf-faster-rcnn训练报错: Loaded runtime CuDNN library: 7.0.5 but source was compiled with: 7.1.4.r-rcn
这是一个巨坑的问题,最近在跑tf-faster-rcnn 遇到错误:搜索到 https://blog.csdn.net/jy1023408440/article/details/82887479 中解决办法,是将tensorflow版本从1.11.0换为1.10.1,安装后还是出错,然后又尝试将tensorflow降了一个小级,安装tensorflow1.10,折腾了一天,居然神奇地可以了!!...原创 2019-08-02 11:27:55 · 827 阅读 · 0 评论 -
计算机视觉三大顶级会议论文ICCV,CVPR,ECCV下载链接
计算机视觉三大顶级会议ICCV,CVPR,ECCV下载链接:ICCV: http://www.informatik.uni-trier.de/~ley/db/conf/iccv/index.htmlECCV: http://www.informatik.uni-trier.de/~ley/db/conf/eccv/index.htmlCVPR: http://dblp.uni-trier.d...转载 2019-08-07 11:35:52 · 2084 阅读 · 0 评论 -
tensorflow error:C++ compilation of rule '//tensorflow/core/kernels:broadcast_to_op' failed(Exit 4)
最近在编译TensorFlow源码,用于 生成.so文件,在用命令编译bazel build -c opt //tensorflow/tools/pip_package:build_pip_packagepip_pakage时,出现错误:C++ compilation of rule ‘//tensorflow/core/kernels:broadcast_to_op’ failed(Ex...原创 2019-08-25 00:13:45 · 3963 阅读 · 0 评论 -
ROI pooling 解释
目标检测typical architecture 通常可以分为两个阶段:(1)region proposal:给定一张输入image找出objects可能存在的所有位置。这一阶段的输出应该是一系列object可能位置的bounding box。这些通常称之为region proposals或者 regions of interest(ROI)。(2)final classification:确...转载 2019-08-28 09:31:29 · 1641 阅读 · 0 评论 -
NMS算法和soft-NMS算法
NMS算法非极大值抑制(NMS)顾名思义就是抑制不是极大值的元素,搜索局部的极大值。这个局部代表的是一个邻域,邻域有两个参数可变,一是邻域的维数,二是邻域的大小。这里不讨论通用的NMS算法,而是用于在目标检测中用于提取分数最高的窗口的。例如在行人检测中,滑动窗口经提取特征,经分类器分类识别后,每个窗口都会得到一个分数。但是滑动窗口会导致很多窗口与其他窗口存在包含或者大部分交叉的情况。这时就需要...原创 2019-08-28 10:39:26 · 4594 阅读 · 0 评论