- 博客(16)
- 资源 (51)
- 收藏
- 关注
原创 深度学习-DRGAN对抗神经网络生成动漫头像
动漫头像素材,项目中新建data文件夹放进去 具体思路是,生成器是将一个噪点生成一副假图片,然后将假图片传给判别器进行判断,如果判别器判断为真,则代码生成器性能很好,而判别器是从真实图片中学习模型,对生成的假图片进行判断,如果判断出来为假则代码判别器性能很好。关于代码的具体注释已经写上,需要单独开博客讲的内容在前几篇博客里写了,直接上代码吧:train.py主运行页面:...
2019-10-31 16:47:11 3616 1
原创 深度学习-逆卷积神经网络ConvTranspose2d
卷积神经网络Conv2d是对图片进行下采样,图片越来越小,而逆卷积神经网络ConvTranspose2d是对图片进行上采样,图片越来越大,卷积与逆卷积是互相对应的。 首先,不管stride等于几,卷积公式都为,逆卷积公式为(注意这个p和s是对应的卷积操作的p和s)。1.当stride=1时:卷积操作:由图片得知,i=4,o=2,k=3,s=1,p=...
2019-10-31 08:49:40 1780
原创 深度学习-Batch normalization的理解
进行多次的数据处理后,可能会导致数据分布不均匀,不同特征值的重要程度不同,比如:左图中w1特征影响较大,w2特征影响较小,所以再进入最中间椭圆后,w2方向几乎不怎么变动了,并且在椭圆的不同位置到达圆心的距离相差很大。而在右图中,圆上同圈内不同位置的点到达圆心的距离是相等的,w1和w2同等重要。所以需要对数据进行归一化,比如normalization 归一化,将数据转换成(0,1)之间...
2019-10-30 17:14:50 233
原创 PyTorch-Tensor基础操作
首先导入import torch as t1.指定tensor形状(随即输出,数值取决于内存空间的状态):a=t.Tensor(2,3)print(a)2.tensor相加:a=t.Tensor([[1,2,3],[1,2,3]])b=t.Tensor([[1,2,3],[1,2,3]])print(a.add(b)) #结果保存到新的tensor中pri...
2019-10-27 16:39:22 2600
原创 论文-《MUREL: Multimodal Relational Reasoning for Visual Question Answering Remi》笔记
重点翻译拓展摘要: 如今在涉及真是图像的VQA任务中,多模态注意力网络时性能最好的,但是这种简单的机制不足以对复杂的推理特征或者高层次的任务进行建模。因此,我们提出了MuRel,一个能在真实图像中学习端到端推理的多模态关系网络。我们的贡献主要有两个:一是引入了MuRel单元,一种通过丰富的向量表示来对问题和图像区域间的交互进行自动推理,和对成对结合区域关系进行建模的结构;二是...
2019-10-26 08:28:33 1863
原创 论文-《MUREL: Multimodal Relational Reasoning for Visual Question Answering Remi》重点翻译+扩展
论文笔记Multimodal attentional networks are currently state-of-the-art models for Visual Question Answering (VQA) tasks involving real images.多模态注意力网络是目前最先进的涉及真实图像的VQA任务模型。In this paper, we propo...
2019-10-25 18:48:49 735
原创 深度学习-ResNet18模型分类CIFAR10数据集详解
简介:首先,ResNet是何凯明大神在2015年提出的,该模型提出后立刻引起轰动。因为在传统卷积神经网络中,当深度越来越深,就会出现梯度消失或者梯度爆炸等问题,从而使准确率降低。结构理解:残差块的短路部分被称作Shortcut Connection,单个残差块的期待输出为H(x),H(x)是由传统卷积层的输出F(x)加短路部分携带的初始数据x求得。特征变换:为了...
2019-10-24 22:42:16 7561 1
原创 深度学习-LSTM与GRU的简单理解
前边我们讲了关于CNN的理解,但是CNN并没有以及能力,所以只能处理一种特定的视觉任务,没法根据以前的记忆来处理新的任务。循环神经网络RNN(Recurrent Neural Network)的提出便是基于记忆模型的想法,期望网络能够记住前面出现的特征,并依据特征推断后面的结果,而且整体的网络结构不断循环,因而得名循环神经网络。循环神经网络目前使用最多的两种变式:LSTM和GRU。传统RN...
2019-10-17 10:45:28 669
原创 深度学习-使用PyTorch分类CIFAR10数据集
十月一前老师布置的任务,让对这个数据集进行分类,我使用的CNN,贴的代码事三层卷积+四层全连接,这几天试了四层卷积和两层全连接以及修改参数的各种混搭组合,就是CPU跑一次数据集太慢了,随机取样那段代码整理的出错,就只能一次性跑全部图片,大概一个多小时才能跑完,心累。训练情况:运行效果:代码:import torchimport torchvisionimport to...
2019-10-17 10:33:27 2316
原创 论文-《Bottom-Up and Top-Down Attention for Image Captioning and Visual Question Answering 》笔记
重点翻译拓展论文下载主题:我们提出将自顶向下和自底向上的注意力机制融合起来,从对象层面计算图像的显著区域。正文:1.新方法的概要过程:自底向上机制(基于Faster R-CNN)提取图像区域,每一个区域关联一个特征向量,自顶向下机制定义特征权重(就是该特征的重要程度)。2.VQA和Image captioning通常使用什么样的方法,有什么缺陷:VQA和Image ...
2019-10-17 08:49:26 496
原创 论文-《Bottom-Up and Top-Down Attention for Image Captioning and Visual Question Answering 》重点翻译+扩展
论文笔记论文下载摘要Abstract Top-down:Top-down visual attention mechanisms have been usedextensively in image captioningand visual question answering (VQA) to enable deeper image understanding through f...
2019-10-16 17:23:13 768
原创 深度学习-卷积神经网络CNN的理解
卷积神经网络的基本形式:卷积神经网络的原理:1.局部性对于一张图片而言,需要检测图片中的特征来决定图片的类别,通常情况下这些特征都不是由整张图片决定的,而是由一些局部的区域决定的。2.相同性对于不同的图片,如果他们具有相同的特征,这些特征会出现在图片的不同的位置,也就是说可以用相同的检测模式取检测不同的图片特征。3.不变性对于一张图片,如果我们进行下采...
2019-10-13 15:23:31 624
原创 深度学习-Sigmoid函数和Softmax函数
1.Sigmoid函数:定义:Sigmoid函数是一个在生物学中常见的S型函数,也称为S型生长曲线。在信息科学中,由于其单增以及反函数单增等性质,Sigmoid函数常被用作神经网络的激活函数,将变量映射到0,1之间,一般用来做二分类。公式:图像:特点:当x趋近于负无穷时,y趋近于0;当x趋近于正无穷时,y趋近于1;当x= 0时,y=0.5。优点:sigmoi...
2019-10-12 20:20:45 2076
原创 深度学习-使用PyTorch显示CIFAR10图像及RGB通道亮度图
目标效果:代码:import numpy as npimport torchfrom torchvision import datasetsimport torchvision.transforms as transformsfrom torch.utils.data.sampler import SubsetRandomSamplerimport matplot...
2019-10-12 11:28:41 2604 1
原创 论文-《Visual Question Answering A tutorial》笔记
重点翻译拓展论文下载主题:本文主要介绍了该领域正在进行的工作以及基于深度学习的VQA如今的方法。正文:1.研究VQA的原因:(1)计算机视觉方面,需要根据算法从图像中提取高水平的数据并进行推理分析,VQA作为最初图灵测试或者图像字幕的替代任务出现。(2)VQA如果发展成熟,可以独立应用于生活。2.VQA答案形式:(1)开放式回答,包含了较为复杂句式,...
2019-10-11 20:59:53 499
原创 论文-《Visual Question Answering A tutorial》重点翻译+扩展
论文笔记论文下载摘要Abstract:Tremendous advances have been seen in the field of computer vision due to the success of deep learning, in particular on low- and midlevel tasks, such as image segmentation or...
2019-10-11 18:30:52 1538
CVPR2018.pdf
2019-10-16
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人