深度学习
文章平均质量分 66
龚大龙
这个作者很懒,什么都没留下…
展开
-
AI视频数字识别、分割(下)
接上一波:神经网络模型训练字符识别断点确定分割视频四、神经网络模型训练有了字符,接下来就是识别了,思路:1、MNIST 那一套直接拿过来用,效果不太好;2、网上也有 tesseract,试了没成功;决定自己训练模型~实现步骤:1、制作样本集(类似MNIST);2、神经网络模型搭建;1. 制作样本集(类似MNIST);参考博客:https://blog.csdn.net/qq_36108664/article/details/107087068实现:① 数据收集(划分原创 2021-03-17 14:33:01 · 811 阅读 · 0 评论 -
AI视频数字识别、分割(上)
任务描述:根据视频中的数字的变化切割视频(国网需求);夜晚热红外视频帧:根据右上角机位数字分割视频思路:视频分帧aoi区域裁剪字符分割神经网络模型训练字符识别断点确定分割视频一、视频分帧# Step1:视频读取、分帧# 1.保存视频每一秒的图面def save_image(image, addr, num): address = addr + str(num) + '.jpg' cv2.imencode('.jpg', image)[1].tofile(原创 2021-03-17 10:24:17 · 1597 阅读 · 0 评论 -
Tensorflow Object Detection API 版本对应关系(CUDA/cudnn/tensorflow-gpu踩坑)
关于Tensorflow Object Detection API中tensorflow-gpu的版本选择:记得一定要去看官网的要求!官网是这么说的:它的版本是tensorflow-gpu 1.12.0,你不能低于1.12.0版本,不然model zoo里面的模型你跑不了~官网:https://github.com/tensorflow/models/blob/master/research...原创 2019-04-14 17:43:34 · 1314 阅读 · 0 评论 -
VOC数据集转换成TFRecord文件
voc数据集的格式voc_to_tfrecord.py# coding=utf-8import osimport sysimport randomimport tensorflow as tffrom PIL import Imageimport xml.etree.ElementTree as ETDIRECTORY_ANNOTATIONS = './Annotations/...原创 2019-04-15 09:42:25 · 4399 阅读 · 8 评论 -
带Json标注的数据集转成TFRecord(TT100K数据集)
问题描述:手上有TT100K数据集,图片标注信息是json文件(作者用Qt开发的标注软件标注),但是想用Tensorflow Object Detection API来训练,之前做的Demo都是xml格式的标注,那么,如何将TT100K转成想要的TFRecord呢?参考上一篇博客(VOC数据集转换成TFRecord文件):https://blog.csdn.net/m0_37970224/ar...原创 2019-04-15 10:06:11 · 4754 阅读 · 16 评论 -
TT100K数据情况、扩增与检查
TT100K数据情况、扩增与检查原创 2019-05-17 10:24:19 · 7643 阅读 · 29 评论 -
YOLO初体验
搞完原创 2019-06-20 16:47:44 · 431 阅读 · 0 评论 -
yolo可视化——loss、Avg IOU、P-R、mAP、Recall (没有xml文件的情况)
训练完模型之后,当然是可视化看看情况如何,这里先声明环境:Ubuntu 16.04、darknet53好,那我们来看这几个指标的可视化吧~一、loss & Avg IOU这两个指标是和训练过程结合在一起的,具体的绘制参考博客:https://blog.csdn.net/qq_34806812/article/details/81459982感谢这位作者,非常的详细~二、P-R曲...原创 2019-07-13 10:37:56 · 7201 阅读 · 3 评论 -
Tensorboard可视化
好久没写博客了~这里记录一下一个小问题吧~如果你是分多次训练的话,就是老是暂停训练再重新训练,那就会生成多个events文件,就像下面这样:如果你想要一起展示出来的话,那就直接用tensorboard --logdir=train_dir另一种情况是,如果你想逐个展示events文件的话,你可以每个events放一个文件夹,像这样:运行tensorboard --logdir=...原创 2019-08-19 11:22:41 · 193 阅读 · 0 评论 -
目标检测、语义分割性能指标
模型训练主要有以下几个性能指标和术语,这边做下记录:IOU(Intersection over Union):即交并比,看下面这张图就非常直观了~三种特殊情况:1、预测框 = 真实框,可得 IoU = 1,不难看出IoU值越高,预测越准2、预测框 与 真实框 交集为0,即挨不着,IoU值为03、一般IoU = 0.5时,视为预测的框有效,并往上分IoU为0.6、0.7、0.8、0....原创 2019-04-17 11:57:22 · 4287 阅读 · 4 评论 -
voc数据集标注格式简单介绍
刚写完coco数据集,顺便把voc数据集的标注格式也介绍一下~两个标注格式最大的不同当然就是:coco标注的文件是json格式的,上一篇博客已经有完整的介绍了而voc则是xml格式的~Pascal VOC数据集介绍首先,voc数据集下载下来会有这么几个文件夹:AnnotationsImageSetsJPEGImagesSegmentationClassSegmentati...原创 2019-04-11 15:59:19 · 22812 阅读 · 0 评论 -
R-CNN算法学习(步骤二:特征提取)
R-CNN算法学习(步骤二:特征提取)写完步骤一(候选区域生成),现在来做步骤二,也就是特征提取,话不多说,请看正文!摘自知乎:https://zhuanlan.zhihu.com/p/23006190CNN特征提取:1.算法实现a、网络结构设计阶段网络架构两个可选方案:经典的Alexne(精度为58.5%)VGG16(精度为66%)VGG模型特点是:选择比较小的卷积核、跨步...原创 2019-01-07 19:35:21 · 7123 阅读 · 4 评论 -
R-CNN算法学习(步骤三:SVM分类)
R-CNN算法学习(步骤三:SVM分类)SVM分类:训练阶段这是一个二分类问题,假设我们要检测车辆。我们知道只有当bounding box把整量车都包含在内,那才叫正样本;如果bounding box 没有包含到车辆,那么我们就可以把它当做负样本。但问题是当我们的检测窗口只有部分包含物体,那该怎么定义正负样本呢?作者测试了IOU阈值各种方案数值0,0.1,0.2,0.3,0.4,0.5。最后...原创 2019-01-07 19:46:12 · 6136 阅读 · 3 评论 -
R-CNN算法学习(步骤四:位置精修)
R-CNN算法学习(步骤四:位置精修)位置精修: 目标检测问题的衡量标准是重叠面积:许多看似准确的检测结果,往往因为候选框不够准确,重叠面积很小。故需要一个位置精修步骤。回归器:对每一类目标,使用一个线性脊回归器进行精修。正则项λ=10000。 输入为深度网络pool5层的4096维特征,输出为xy方向的缩放和平移。训练样本:判定为本类的候选框中和真值重叠面积大于0.6的候选框。...原创 2019-01-07 19:46:28 · 1348 阅读 · 1 评论 -
卷积神经网络的现代雏形——LeNet
一、前言LeNet-5出自论文Gradient-Based Learning Applied to Document Recognition,是一个用来识别手写数字的最经典的卷积神经网络,是Yann LeCun在1998年设计并提出的。个人主页:http://yann.lecun.com/论文链接:https://pan.baidu.com/s/1nEQFgsonFVm790MhJA8kD...原创 2019-02-23 16:32:03 · 714 阅读 · 0 评论 -
mnist手写数字辨识实战——改进的LeNet
手写数字辨识应该说的深度学习入门的HelloWorld,仔细认真的搞完这个的话,对后面其他模型结构的实验学习是非常有帮助的,那话不多说,go~一般三步搞定搭建网络模型训练网络模型测试网络模型一、搭建网络模型mnist_inference.py这里就是定义一个网络模型,你也可以改成什么AlexNet、ZFNet、ResNet、GoogleNet、VGG、你有兴趣你就这么去玩...原创 2019-03-16 19:22:02 · 882 阅读 · 0 评论 -
Win10+GT1080ti+Anaconda+Pycharm
首先,我想说MMP~tensorflow版本不一样真的把我搞屎掉了,简直了,马勒戈壁蛋安装步骤:网上倒是有很多的教程,但是但是但是!!!!那个啥!你要看清楚tensorflow-gpu的版本对应支持的python版本,python版本太高或者tensorflow-gpu版本太高都会让你奔溃!!!麻烦麻烦麻烦,你好好看看对应关系!!!去这里看看,官网里面有说对应关系https://te...原创 2019-03-18 20:08:48 · 192 阅读 · 0 评论 -
TensorFlow Object Detection API入门例子 (小浣熊检测上)
玩了一周的TensorFlow Object Detection API了,是时候记录一下,踩过的坑都快忘记了~首先,总结一下检测的流程,实验分以下几步完成:收集并标注数据数据格式转换确定训练模型开始训练导出模型并测试一.收集并标注数据下载链接:链接: https://pan.baidu.com/s/14jaDchHUYH4Tc0BWSDcTkg 提取码: a4we...原创 2019-03-25 17:23:06 · 417 阅读 · 2 评论 -
TensorFlow Object Detection API入门例子 (小浣熊检测下)
上篇文章讲了两点:收集并标注数据数据格式转换(tfRecord)接下来我们来讲确定训练模型开始训练导出模型并测试好,那我们就开始吧~~~一 训练模型模型选择创建一个data文件夹把train.record和test.record放进去Tensorflow detection model zoo 提供了很多模型链接:https://github.com/tensor...原创 2019-03-25 19:59:14 · 611 阅读 · 0 评论 -
TensorFlow Object Detection API 安装使用
谷歌开源的 TensorFlow Object Detection API 玩起来还不错,虽然我还没深度的剖析其内部的东西,这里只是做个记录,防止自己以后忘记,重新捡起来,浪费时间~当时,我把自带的demo跑起来的时候,可是花了不少的时间,而且遇到了不少的坑~一步一步重新捡起来吧~一 下载模型直接给出链接:https://github.com/tensorflow/models(版本一直...原创 2019-03-26 14:53:12 · 368 阅读 · 1 评论 -
TensorFlow Object Detection API视频检测
上面几篇文章已经初步讲解了TensorFlow Object Detection API的安装使用利用TensorFlow Object Detection API进行小浣熊的检测(图片)这节讲解利用 TensorFlow Object Detection API (基于已经训练好的小浣熊检测模型)进行视频检测~这是参考博客:https://blog.csdn.net/xiaoxiao...原创 2019-03-27 10:02:02 · 693 阅读 · 0 评论 -
R-CNN算法学习(步骤一:候选区域生成)
R-CNN算法学习论文链接:https://arxiv.org/abs/1311.2524源码链接:https://github.com/rbgirshick/rcnn算法整体思想总体分为 四个步骤(下文讲逐步骤分析):1.候选区域生成: 一张图像生成1K~2K个候选区域 (采用Selective Search 方法)2.特征提取: 对每个候选区域,使用深度卷积网络提取特征 (CNN)...原创 2018-12-27 15:55:28 · 20477 阅读 · 6 评论