深度学习
文章平均质量分 79
wxplol
这个作者很懒,什么都没留下…
展开
-
深度学习分类优化实战
文章目录一、优化策略1、CIFAR-100 数据集简介2、模型评估指标3、数据!数据!数据!3.1、数据增强3.2、数据分布4、模型选择5、模型优化5.1、学习率选择5.2、优化器选择5.3、学习率更新策略选择5.4、loss选择6、整体思路二、pytorch实战近期做了一些与分类相关得实验,主要研究了模型有过过程中的一些优化手段,这里记录下,本文对相关模型和算法进行了实现并运行测试,整体来说,有的优化手段可以增加模型的准确率,有的可能没啥效果,总的记录如下文。本文使用得数据集为CIFAR-100 。代原创 2022-05-23 15:04:05 · 910 阅读 · 0 评论 -
【深度学习系列(八)】:Transoform原理及实战之原理篇
tranformer文章目录tranformer[1 模型结构概览](https://datawhalechina.github.io/dive-into-cv-pytorch/#/chapter06_transformer/6_1_hello_transformer?id=_611-模型结构概览)[2 模型输入](https://datawhalechina.github.io/dive-into-cv-pytorch/#/chapter06_transformer/6_1_hello_transfor转载 2021-10-17 16:44:09 · 1353 阅读 · 0 评论 -
基于onnxruntime的YOLOv5单张图片检测实现
pytorch的前向推理,但是这个推理过程需要依赖yolov5本身的模型文件以及结构搭建的过程,所以还是比较麻烦的。这里,有没有一个直接前向推理,然后只处理结果,无需考虑yolov5本身的文件。所以现在介绍的是基于onnx的推理。这个推理过程也很简单,将原模型转化为onnx格式,然后再使用onnxruntime进行就可以了原创 2021-05-12 12:07:07 · 11291 阅读 · 29 评论 -
基于pytorch的YOLOv5单张图片检测实现
当我们训练完yolov5模型后,如何使用这个模型呢?这里简单写一下,可以看到大部分代码在detect.py中都可以找到,算是我自己对这个代码的改装吧,有需要的可以看看。原创 2021-05-11 17:04:45 · 4141 阅读 · 0 评论 -
win10下在vs2015上进行yolov5 TensorRT加速实践
文章目录1、安装环境2、生成yolov5s.wts文件3、vs2015环境搭建4、TensorRt加速实现1、安装环境CUDA10.2TensorRT7.2OpenCV3.4(工程中已给出,不需安装)vs20152、生成yolov5s.wts文件在生成yolov5s.wts前,首先需要下载模型。同时,需要我们安装ultralytics/yolov5环境。这里可以参考网上其它文章或github教程进行配置安装,这里不详加说明。将tensorrtx-master\yolov5文件夹下的ge原创 2020-12-21 01:05:53 · 3864 阅读 · 42 评论 -
Tensorflow2 常见的数据增强方法及其实现汇总
数据增强主要分为监督的数据增强和无监督的数据增强方法。其中有监督的数据增强又可以分为单样本数据增强和多样本数据增强方法,无监督的数据增强分为生成新的数据和学习增强策略两个方向。原创 2020-08-12 21:10:39 · 5313 阅读 · 0 评论 -
《YOLOv4: Optimal Speed and Accuracy of Object Detection》论文翻译
最新的YoloV4已经出来好久了,今天主要读一下看看相比于YoloV3有什么改进和创新的地方,主要是来学习学习。废话不多说,开始。 Abstract 摘要 There are a huge number of features which are said to improve Convolutional Neural Network (CNN) accuracy. Practical testing of combinations of such feature翻译 2020-07-05 22:34:50 · 898 阅读 · 0 评论 -
常见CNN网络创新点
这篇文章主要介绍卷积神经网络1998年到2019年的20多种经典的网络,体会每种网络的前世今身以及包含的深邃思想。算是一个总结性的博客吧。。。一、1998年:LeNet1988年,Yann LeCun(深度学习三巨头之一,2019年获得图灵奖)提出了用于手写字符识别的卷积网络模型LeNet5。其原理结构比较清晰,如图所示。当年,美国很多企业都采用了该模型用于识别现实场景中的数字,例如邮政编码、手写数字等,能够达到商用的程度,可见其在AI领域的开创性地位。在论文中,LeNet5被用于识别MNIST原创 2020-06-30 20:38:35 · 3420 阅读 · 0 评论 -
【深度学习系列(七)】:基于TensorFlow异常检测的实现
一、异常检测异常定义为偏离标准,很少发生且不遵循其余“模式”的事件。异常的例子包括:由于世界大事而导致的股市大跌 工厂/传送带上的不良物品 实验室中被污染的样品假设我们的数据服从一个正太分布,那么通常异常数据位于正态分布曲线的两侧。如下图所示。正在上传…重新上传取消正在上传…重新上传取消正在上传…重新上传取消正如我们看到的那样,这些事件将发生,但发生的可能性极低。从机器学习的...原创 2020-04-04 00:29:40 · 2836 阅读 · 5 评论 -
【深度学习系列(六)】:RNN系列(6):使用TextCNN实现对文本的分类
我们知道在卷积神经网络不仅用于图像处理领域,在NLP领域也会有很好的使用效果,其中TextCNN是卷积神经网络在文本处理方面的一个知名的模型。在TextCNN模型中通过卷积技术实现对文本的分类功能。目前文本分类在工业界的应用场景非常普遍,从新闻的分类、商品评论信息的情感分类到微博信息打标签辅助推荐系统,都用到了这种技术。下面我们主要了解这个模型的实战以及注意点。原创 2020-03-14 14:58:05 · 2114 阅读 · 0 评论 -
【深度学习系列(六)】:RNN系列(5):RNN模型的奇淫巧技之灵活的注意力机制
解决NLP任务的三大法宝:注意力机制、卷积神经网络以及循环神经网络。可见注意力机制对于NLP来说非常重要,所以这里着重说一说注意力机制,以及灵活的使用注意力机制到实际工程中。众所周知,注意力机制通常是运用于seq2seq模型中,我们常用的注意力机制是基于信息的注意力机制,也就是说我们只选择一些关键的的输入信息进行处理,但有时我们也需要关注其他信息,比如说位置信息。在进行公式时别、语音时别等一些场合中,字符间位置信息也非常重要,所以这一篇中我们将介绍如何灵活的改装seq2seq的注意力机制,运用于我们实际原创 2020-03-20 21:19:09 · 2064 阅读 · 0 评论 -
【深度学习系列(六)】:RNN系列(5):RNN模型的奇淫巧技之动态路由
动态路由与注意力机制类似,其主要目的是为序列数据分配对应参数c这点有点类似与注意力机制。从实践中证明,与注意力机制相比,动态路由的算法在精度有所提升。与注意力机制中采用相似度算法计算权重不同,本文采用动态路由的算法来分配权重。动态路由算法使用于胶囊网络,这里主要借鉴这一算法,并运用于RNN中。在实践中证明,CNN或RNN中的一些算法可以相互借鉴,有时会有奇效。具体实践细节看一看本篇。。。原创 2020-03-09 15:36:11 · 2556 阅读 · 9 评论 -
【深度学习系列(六)】:RNN系列(4):带注意力机制的seq2seq模型及其实战(2):为图片添加内容描述
这里主要是对前面基于Attention的seq2seq的实战,通过seq2seq来对图片进行描述,废话不多说,一起动手吧原创 2020-02-24 17:57:47 · 1717 阅读 · 8 评论 -
【深度学习系列(六)】:RNN系列(3):基于Tensorflow的RNN的实战之英文名字生成
原创 2020-02-20 17:23:48 · 1371 阅读 · 10 评论 -
【深度学习系列(六)】:RNN系列(4):带注意力机制的seq2seq模型及其实战(1)
参考链接:Seq2Seq模型讲解完全图解Seq2Seq Attention模型完全解析RNN, Seq2Seq, Attention注意力机制原创 2020-02-22 19:23:41 · 4346 阅读 · 0 评论 -
【深度学习系列(六)】:RNN系列(2):RNN的基础单元之QRNN、IndRNN以及JANET
Table of Contents一、QRNN1.1、QRNN网络结构二、IndRNN2.1、IndRNN网络结构三、JANET3.1、JANET网络结构一、QRNN1.1、QRNN网络结构QRNN(Quasi-Recurrent Neural Networks)二、IndRNN2.1、IndRNN网络结构独立循环神经网络(indRNN)三、JA...原创 2020-01-13 22:01:02 · 1211 阅读 · 0 评论 -
【深度学习系列(六)】:RNN系列(2):RNN的基础单元之LSTM、GRU以及SRU
目录一、LSTM网络1.1、遗忘门1.2、输入门1.3、输出门二、GRU网络2.1、重置门2.2、更新门三、SRU网络3.1、SRU网络结构3.2、SRU并行优化四、总结人对一个问题的思考不会完全从头开始。比如你在阅读本片文章的时,你会根据之前理解过的信息来理解下面看到的文字。在理解当前文字的时候,你并不会忘记之前看过的文字,从头思考当前文字的含义...原创 2020-01-12 18:25:51 · 3284 阅读 · 0 评论 -
【深度学习系列(六)】:RNN系列(1):基于python的RNN实现
这篇文章主要详细介绍的RNN的原理。由于看到CRNN这块,想着把RNN也好好看看,所以留下第五系列的坑,以后有时间再填吧。。。目录1、基于Python的RNN实践2、加载数据集3、RNN网络模型3.1、前向传播3.2、反向传播(BPTT)4、模型优化5、模型预测RNN(Recurrent Neural Network)是一类用于处理序列数据的神经网络。首先我们要...原创 2020-01-09 22:00:53 · 4068 阅读 · 0 评论 -
【深度学习系列(五)】:基于tensorflow的CRNN实现 (1):论文阅读
An End-to-End Trainable Neural Network for Image-based Sequence Recognition and Its Application to Scene Text Recognition作者:Xiang Bai(个人主页:http://mc.eistar.net/~xbai/) 论文的下载地址:https://arxiv.org/pdf...翻译 2020-01-08 11:12:04 · 1098 阅读 · 1 评论 -
【深度学习系列(四)】:基于tensorflow的YOLOV3实现 (3):YOLOV3模型优化
通过上一篇文章:【深度学习系列(四)】:基于tensorflow的YOLOV3实现 (2):YOLOV3框架结构,我们基本了解了YOLOV3网络在进行前向运算的细节,这里具体说明下YOLOV3在预测过程中的流程:输入一张任意大小图片,保持长宽比不变的情况下,缩放至 w 或 h 达到416,再覆盖在416*416的新图上,作为网络的输入。即网络的输入是一张416*416,3通道的RGB图。 运...原创 2019-11-06 14:48:20 · 2224 阅读 · 0 评论 -
【深度学习系列(四)】:基于tensorflow的YOLOV3实现 (2):YOLOV3框架结构
目录前言1、backbone2、多尺度融合检测3、模型输出预测小结前言YOLOV3以V1和V2为基础进行改进得。YOLO3主要的改进有:调整了网络结构;利用多尺度特征进行对象检测;对象分类用Logistic取代了softmax。如果想了解V1、V2的详细结构信息,可以参照以下链接。YOLO v1深入理解YOLOv2 / YOLO9000 深入理解YOLOv3...原创 2019-10-30 11:17:21 · 2600 阅读 · 2 评论 -
【深度学习系列(四)】:基于tensorflow的YOLOV3实现 (1):YOLOV3初探
最近一直在研究目标检测相关方法。其中YOLOV3的综合性能目前来说工业运用比较广泛,所以,的好好研究研究。本系列是使用tensorflow简单的实现YOLOV3算法,但是麻雀虽小,五脏俱全啊,哈哈哈哈。什么是YOLO?它是一种使用深卷积神经网络学习的特征来检测物体的目标检测器。官网中yolo是基于Darknet框架实现的,该框架是纯c实现,墙裂推荐去看看它的源码。实际运用中,比如嵌入式等机器上...原创 2019-10-29 14:07:36 · 5711 阅读 · 0 评论 -
【深度学习系列(二)】:基于c++实现一个简单的神经网络(3)
3、前向和反向传播1. 单个神经元的前向和反向计算众所周知,神经网络是由一系列的神经元组成,那具体长什么样呢?可以看下面的图。 所以,对于一个神经元来说,其前向计算公式如下: 其中...原创 2019-04-25 16:33:28 · 1931 阅读 · 2 评论 -
【深度学习系列(二)】:基于c++实现一个简单的神经网络(2)
2、模型的搭建及初始化 在我们读取数据集时我们已经知道输入的神经元个数,在构造NN类时我们需要设置分类数,也就是说我们已经知道输入和输出的神经元个数,所以只要知道隐藏层的层数及每层的神经元个数,那么整个神经网络也就搭建完成了。本程序中通过容器保存插入每层隐藏层神经元个数来确定隐藏层的层数和个数。搭建整个网络,其实就是依次创建每一层的权重和偏置的矩阵,并分别保存到存储权重和偏置的容器中...原创 2019-02-01 15:04:38 · 1449 阅读 · 0 评论 -
【深度学习系列(二)】:基于c++实现一个简单的神经网络(1)
学习深度学习首先得知道反向传播,这是神经网络能够学习得重要原因,也是深度学习得基石。所以,本系列以此为开篇,着重介绍神经网络得正向/反向传播得流程。哈哈,肯定有人会问为什么用C++实现,python不是更好吗?哈哈,本人严重C++控,好吧后续得一些文章大多是基于c++实现的,所以,最好有一定的c++基础。本文代码得配置要求:C++ OpenCV3.4完整的代码工程可以访问我的g...原创 2019-01-31 17:29:47 · 5723 阅读 · 4 评论 -
【深度学习系列(一)】:前言
学深度学习有一年多了,当初主要是为了研究生毕业好写论文,所以看了好多基础性的东西。虽然学了看了很多相关的文章和视频,但总感觉没有摸到门路,也忘记了好多。今天写这个系列主要是为了记录总结之前学过的东西,也是为了记录将要学到的东西。总而言之,我会一直更新来记录我在深度学习路上的点点滴滴。 记得当初为了水一片大论文,我当时仔细研究了faster-rcnn,在我学习的过程中遇到好...原创 2019-01-31 16:17:26 · 313 阅读 · 0 评论 -
python使用matplotlib画图出现中文乱码
在windows下使用matplotlib画图时会出现中文乱码现象,为了永久解决之一现象,有以下几个步骤:1、修改matplotlibrc进入Python安装目录下的Lib\site-packages\matplotlib\mpl-data目录,打开matplotlibrc文件,删除font.family和font.sans-serif两行前的#,并在font.sans-serif后添加微原创 2018-01-05 21:00:23 · 376 阅读 · 0 评论