深度学习
文章平均质量分 61
tommorrow12
这个作者很懒,什么都没留下…
展开
-
Pytorch 安装 apex 疑难杂症解决方案
RuntimeError: Cuda extensions are being compiled with a version of Cuda that does not match the version used to compile Pytorch binaries. Pytorch binaries were compiled with Cuda 9.0.176.从描述可以看出是...原创 2020-01-07 16:58:40 · 10682 阅读 · 7 评论 -
Holistic Recognition of Low Quality License Plates by CNN using Track Annotated Data 翻译
通过CNN使用跟踪注释数据整体识别低质量车牌摘要本文专注于识别低分辨率和低质量的车牌图片。我们提出了一个收集现实世界(非合成)有标注的低质量车牌照片的数据集的方法。我们的车牌识别方法是基于一个从整体上处理整张图片的卷积神经网络,从而避免了车牌字符的切割。在多个数据集上的评估结果显示我们的方法明显优于其他低质量图片车牌识别的一些免费的和商业的解决方案。为了进一步研究低质量图片的车牌识别,我们...原创 2018-07-24 16:30:48 · 1854 阅读 · 0 评论 -
深度学习与卷积神经网络
深度学习概述深度学习是机器学习领域的一个重要分支,由人工神经网络演变而来,其目的是生成一个能够模拟人脑工作的深度神经网络[6]。传统人工神经网络的网络层数较少,所以只是浅层学习,深度学习则使用一系列的非线性变换构建多个隐藏层(一般大于5层)的神经网络,从十分庞大的数据中提取出抽象的特征,从而达到提高分类和预测准确度的最终目的[4]。目前,深度学习已经在语音辨别、图像与视频分析、数据挖掘等诸多领...原创 2018-07-24 18:05:22 · 2814 阅读 · 0 评论 -
到底什么是最小二乘法
原文链接:http://blog.sina.com.cn/s/blog_7445c2940102wjz8.html#commentComment最小二乘法,又是一个即熟悉又陌生的名字。对于学工科的我,简直就是听着最小二乘长大的(汗。。。)。但是,之前碰到要用最小二乘法的时候,我采取的办法都是拿来主义(抄。。。),并没有系统的了解一下什么是最小二乘法。包括最小二乘这个叫法,也从来都不理解(一直以...转载 2018-08-02 10:00:10 · 790 阅读 · 0 评论 -
Domain generalization
一、综述 最近由于交流的需要,读了几篇关于Domain adaptation的文章,其中一种名叫Domain generalization的技术引起了我的注意,这种技术可以在target domain未知的情况下训练出分类器而且性能还相当不错,下面就对这种技术进行一下简单的介绍。二、迁移学习 提到Domain adaptation,就不得不提到迁移学习(transfer learnin...转载 2018-11-20 20:42:50 · 3657 阅读 · 0 评论 -
近十年以来机器学习中最优秀的想法之一~领略GANs核心
前言这篇文章中,作者通过将生成对抗网络(GANs,以下均简称GANs)运用到图片生成任务中向我们解释了其的原理。GANs是无监督学习中少有的成功的技术,一经提出,将生成任务推动到了新的高度上。在多样的图片生成任务中,GANs独领风骚。Yann LeCun(深度学习的先驱)将GANs称作“近十年以来机器学习中最优秀的想法”。最重要的是,在显著的性能的同时,GANs的核心思想又是那么地浅显易懂。本...转载 2019-03-17 13:44:17 · 494 阅读 · 0 评论 -
STN:空间变换网络(Spatial Transformer Network)
最近在学习stn,看到一篇能够读懂的博客,转载一下供大家学习交流。本文的参考文献为:《Spatial Transformer Networks》卷积神经网络定义了一个异常强大的模型类,但在计算和参数有效的方式下仍然受限于对输入数据的空间不变性。在此引入了一个新的可学模块,空间变换网络,它显式地允许在网络中对数据进行空间变换操作。这个可微的模块可以插入到现有的卷积架构中,使神经网络能够主动地在...转载 2019-04-08 19:31:40 · 1947 阅读 · 0 评论 -
ST-GAN: Spatial Transformer Generative Adversarial Networks for Image Compositing 原文翻译
ST-GAN:用于图像合成的空间变换器生成敌对网络目录摘要1.介绍2.相关工作3.方法3.1、迭代几何校正3.2、顺序对抗训练3.3、敌对目标4.实验4.1、3D立方体4.2、室内物体4.3、眼镜5.结论论文地址摘要我们解决了向前景对象发现真实几何校正的问题,使得它在合成到背景图像时显得自然。为了实现这一目标,我们...原创 2019-04-13 21:52:08 · 4508 阅读 · 1 评论 -
2018最佳GAN论文回顾
摘要:2018年关于GAN最有趣的文章。原文链接我很高兴今年参加了一个研究项目,这要求我必须熟悉大量用于计算机视觉方面的深度学习领域的资料。我对过去两、三年内取得的进展感到惊讶,这真的非常令人兴奋和鼓舞,所有不同的子领域,如图像修复、对抗性样本、超分辨率或是三维重建,都大大得益于近期的发展。然而,有一种神经网络,它受到了大量的宣传和炒作 — 生成性对抗网络(Generative ...转载 2019-04-17 22:25:59 · 710 阅读 · 0 评论 -
Learning to Compare: Relation Network for Few-Shot Learning阅读笔记
这两天在看ZSL的相关论文,读到这篇没看懂,去网上找了一下解读,觉得这篇不错,分享给大家。1. 前言相信每一位研究深度学习的朋友都明白,深度学习能够在这几年取得如此爆炸式的发展,除了算法本身的改进与创新,最关键的因素就是拥有海量的数据和强大的计算资源。那么,我们很自然的会问:没有海量数据怎么办?现实生活中有很多问题并没有那么多的数据可以采集,或者说采集数据所需的成本很高,比如稀有物种的图片...转载 2019-08-06 21:47:08 · 483 阅读 · 0 评论 -
SSD原理解读
1、引言目标检测是计算机视觉学科的重要研究方向之一,在很多场合中都很重要,比如无人驾驶,就非常需要目标检测给它提供非常高的检测和定位精度。当前,目标检测中基于深度学习的算法大概可以分为两种:分步目标检测算法(比如Fast R-CNN[11]、Faster R-CNN[12]等);单步目标检测算法(比如YOLO[13]、SSD[14]等)。前者先要产生一批用作输入数据的候选框,然后经过神经网...原创 2018-07-24 15:53:39 · 6198 阅读 · 0 评论 -
torch.nn.Embedding理解
Pytorch(0.3.1)官网的解释是:一个保存了固定字典和大小的简单查找表。这个模块常用来保存词嵌入和用下标检索它们。模块的输入是一个下标的列表,输出是对应的词嵌入。torch.nn.Embedding(num_embeddings, embedding_dim, padding_idx=None, max_norm=None, norm_type=2, scale_grad_by_fre...原创 2018-07-03 11:52:23 · 85592 阅读 · 22 评论 -
SSD(single shot multibox detector)算法及Caffe代码详解
转载自AI之路的CSDN博客,原始链接地址:https://blog.csdn.net/u014380165/article/details/72824889这篇博客主要介绍SSD算法,该算法是最近一年比较优秀的object detection算法,主要特点在于采用了特征融合。论文:SSD single shot multibox detector 论文链接:https://arxiv.org/a...转载 2018-04-02 15:48:36 · 188 阅读 · 0 评论 -
系统学习深度学习(一) --深度学习与神经网络关系
转自:http://blog.csdn.net/zouxy09/article/details/8775518Deep Learning的基本思想 假设我们有一个系统S,它有n层(S1,…Sn),它的输入是I,输出是O,形象地表示为: I =>S1=>S2=>…..=>Sn => O,如果输出O等于输入I,即输入I经过这个系统变化之后没有任何的信息损失(呵...转载 2018-04-27 10:10:26 · 628 阅读 · 0 评论 -
看懂vgg16
刚开始接触深度学习、卷积神经网络的时候非常懵逼,不知道从何入手,我觉得应该有一个进阶的过程,也就是说,理应有一些基本概念作为奠基石,让你有底气去完全理解一个庞大的卷积神经网络:本文思路:一、我认为学习卷积神经网络必须知道的几个概念:1、卷积过程: 我们经常说卷积神经网络卷积神经网络,到底什么才是卷积?网络层卷积过程到底怎么实现?我们在这里借鉴了另一位博客大牛的动态图来给大家演...转载 2018-04-27 10:11:09 · 21467 阅读 · 16 评论 -
基于深度学习的目标检测技术演进:R-CNN、Fast R-CNN、Faster R-CNN
转载自:https://www.cnblogs.com/skyfsm/p/6806246.htmlobject detection我的理解,就是在给定的图片中精确找到物体所在位置,并标注出物体的类别。object detection要解决的问题就是物体在哪里,是什么这整个流程的问题。然而,这个问题可不是那么容易解决的,物体的尺寸变化范围很大,摆放物体的角度,姿态不定,而且可以出现在图片的任何地方,...转载 2018-05-06 21:42:08 · 243 阅读 · 0 评论 -
迁移学习的两种类型
转载自:https://blog.csdn.net/wmz545546/article/details/77603543迁移学习两种类型:ConvNet as fixed feature extractor:利用在大数据集(如ImageNet)上预训练过的ConvNet(如AlexNet,VGGNet),移除最后几层(一般是最后分类器),将剩下的ConvNet作为应用于新数据集的固定不变的特征提取...转载 2018-05-15 10:08:22 · 4498 阅读 · 1 评论 -
Relation Networks for Object Detection重点解读
网络总体图: relation内部图: 1、分别根据两个特征计算它们各自的权重2、由两个特征的权重获得总权重3、按照第m个物体对当前物体的总权重,加权求出各个relation模块4、concat所有relation模块,与原来的特征叠加,最终输出通道数不变的新特征 Concat就是聚合各个,表示第n个relation模块的输出。后两层网络示意图: 去重网络的原文描述如下: 参考网址:http...原创 2018-06-21 09:26:44 · 1018 阅读 · 0 评论 -
Faster-rcnn详解
Faster R-CNN算法是在Fast R-CNN算法的基础上,将RPN与Fast R-CNN结合到一个深度神经网络中的端到端的目标检测网络。Faster R-CNN由候选区域框网络(Region Proposal Network,简称RPN)和Fast R-CNN网络两部分组成。整体网络框架如图3-1所示。 图3-1 Faster R-CNN框架其中,RPN是全卷积神经网络,用于提取候选框;F...原创 2018-06-15 19:46:19 · 725 阅读 · 0 评论 -
深度残差网络ResNet
今天看了一下残差网络,看了几篇博客都没理解,继续看,终于被我弄清了。下面写一下心得。我说的是大方面的,小细节可以参看:https://my.oschina.net/u/876354/blog/1622896#comments,写的不错。出现原因:随着网络层级的不断增加,模型精度不断得到提升,而当网络层级增加到一定的数目以后,训练精度和测试精度迅速下降,所以当网络变得很深以后,深度网...原创 2018-06-20 10:01:16 · 558 阅读 · 0 评论 -
Fast R-CNN笔记
本文转载自XZZPPP的CSDN博客,原始链接地址:https://blog.csdn.net/XZZPPP/article/details/513777711、简介Fast R-CNN将整个图片送入网络时同时将object proposal(这里称为RoI,一张图片中得到约2k个)也送入网络,每一个RoI被Rol pooling layer(相当于一个单层的SPP layer)统一到一个固定大小...转载 2018-04-09 10:42:08 · 146 阅读 · 0 评论