自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Vivinia的博客

深度学习新渣一枚

  • 博客(379)
  • 资源 (51)
  • 收藏
  • 关注

原创 深度学习-变分自编码器(VAE)生成MNIST手写数字图片

MNIST数据集:数据集下载下载好数据集新建MNIST文件夹,再在里边建一个raw文件夹,数据集解压后放到raw文件夹中(数据集后缀为.gz,不需要再解压了)简介:变分自编码器(Variational Autoencoder,VAE)是生成式模型(Ggenerative Model)的一种,另一种常见的生成式模型是生成式对抗网络(Generative Adversial Network...

2020-04-27 15:03:28 7296 9

原创 python-OpenGL编程实例

1.黄色背景红色矩形from OpenGL.GL import *from OpenGL.GLUT import *def draw(): glFlush() # 清空缓冲区,将指令送往硬件立即执行 glClearColor(1.0, 1.0, 0, 0) #设置清除颜色为黄色 glClear(GL_COLOR_BUFFER_BIT) #把窗口清除...

2019-12-29 16:34:36 1018

原创 python-PyCharm安装OpenGL

OpenGL是一个比较经典的图形库,如果使用PyCharmsetting那里导入,默认导入的是32位的,如果你的电脑是64位的,要自己下载64位对应的库。1.下载链接我的python是3.7的,我理解的是对应于库名中的37.2.因为我折腾了很多地方,我不知道是不是随便保存安装就好,最后为了保险我是存在了python.ene那个保存库的文件夹中,比如我一般只使用pythonTest这个...

2019-12-20 09:38:07 3681

原创 深度学习-词频统计

项目下载项目页面:目标效果:代码:import reimport pandasimport jiebaimport numpyimport warningsimport matplotlib.pyplot as pltfrom wordcloud import WordCloudwarnings.filterwarnings("ignore") #忽略警...

2019-11-30 22:39:13 420

原创 论文-《From Recognition to Cognition: Visual Commonsense Reasoning》笔记

论文下载摘要(Abstract): Visual understanding goes well beyond object recognition. With one glance at an image, we can effortlessly imagine the world beyond the pixels: for instance, we can infer peo...

2019-11-29 18:40:35 1218 2

原创 深度学习-强化学习Q-learning算法简易实现

目标效果:这里贴一下Q-learning的公式:代码:import numpy as npimport pandas as pdimport timenp.random.seed() # 计算机产生一组伪随机数列N_STATES=6 # 有多少个state,即有多少种状态,最开始的距离离宝藏的距离多少步ACTIONS=['left','right'] # 两...

2019-11-26 14:53:27 576

原创 论文-《GQA: A New Dataset for Real-World Visual Reasoning and Compositional Question Answering》

论文下载摘要(Abstract):We introduce GQA, a new dataset for real-world visual reasoning and compositional question answering, seeking to address key shortcomings ofprevious VQA datasets. We have develop...

2019-11-26 11:46:36 1988

原创 深度学习-深度可分离卷积详解

为了计算方便,这里先固定stride=1,padding=1,卷积核大小DK=3,这样卷积后和之前的特征图大小相等,都是DF。普通卷积: M=3为通道数,DF为特征图大小,N=5为卷积核个数,经过卷积特征图大小为DF不变,通道变为N。 矩阵运算次数:DF*DF*M*N*DK*DK 卷积核参数:DK*DK*M*N...

2019-11-18 15:34:27 1391 1

原创 论文-《Visual Question Answering as Reading Comprehension Hui》笔记

论文下载摘要:Visual question answering (VQA) demands simultaneous comprehension of both the image visual content and natural language questions. In some cases, the reasoning needs the help ofcommon sen...

2019-11-17 11:47:40 441

原创 深度学习-使用RNN生成诗

代码连链接 这里稍微更改了下《深度学习框架PyTorch:入门与实践》里的demo,去掉稍微繁琐和多次训练的部分,只保留了比较核心的生成连接诗和藏头诗两部分(比较渣太复杂了看不懂)。目标效果:连接诗:机器学习书,局上无酒浆。婆娑珍金盘,缕烂金葳浆。萱草发秋叶,旖旎镂金墙。拳芳既盈薄,禄位不敢匼。揆我不及饱,有时不相并。我为蘧生意,日出狱所宣。徇禄惩未卜,退食何由尝。濡毫...

2019-11-15 16:30:08 1413 7

原创 深度学习-Word Embedding的详细理解(包含one-hot编码和cos余弦相似度)

这两天在费劲的研究单词嵌入Embedding,好不容易稍微懂了一点,赶紧记下来省的忘了。ont-hot编码: 一般在输入的时候,都会将所有的单词看作一个向量,只把当前的单词置为1,以下为几组单词表和单词向量的表示方式:当前单词为apple[apple,man,banana,cat......,orange,kite][1,0,0,0...0,0]...

2019-11-12 15:40:02 2788

原创 深度学习-t-SNE对S型数据降维

目标效果:代码:import numpy as npfrom sklearn.manifold import TSNEfrom time import timeimport matplotlib.pyplot as pltfrom mpl_toolkits.mplot3d import Axes3Dfrom sklearn import manifold, datas...

2019-11-09 20:30:00 813

原创 深度学习-使用t-SNE对MNIST数据集进行分类

我们在对数据进行降维时,比较常用的方法有LLE(局部线性嵌入),LE(拉普拉斯映射)还有t-SNE,前两种主要考虑高维中距离相近的点在低维中还要保持距离相近,但是没有考虑高维中距离较远的点在低维是怎样的情况,而t-SNE恰好解决了这个问题,t-SNE的目标是高维中距离相近的点低维中还要相近,高维中距离较远的点,低维中距离要被拉大。 t-SNE将相似度转换为一种概率...

2019-11-08 16:38:39 5533 3

原创 python-numpy中axis的理解

今天在看代码时,发现一个小地方,就是求每行每列的最大最小元素时,感觉对轴0和1的设置有点转不过弯来,于是写了一小段代码帮助理解。import numpy as npa=np.array([[1,5,3],[4,2,6],[-5,4,9],[7,0,-9],[10,-2,6]])print("初始矩阵:")print(a)print("求矩阵中最小元素:")print...

2019-11-08 16:15:39 143

原创 python-读取、显示、保存图片

目标效果:代码:import matplotlib.pyplot as plt # plt 用于显示图片import matplotlib.image as mpimg # mpimg 用于读取图片import numpy as np"""读取图片并显示"""imgRgb = mpimg.imread('imgBefore.jpg') # 读取和代码处于同一目录下的 ...

2019-11-08 12:49:33 639

原创 论文-《Answer Them All! Toward Universal Visual Question Answering Models》笔记

重点翻译拓展论文下载摘要:Visual Question Answering (VQA) research is split into two camps: the first focuses on VQA datasets that require natural image understanding and the second focuses on synthetic dat...

2019-11-05 20:24:00 765

原创 论文-《Answer Them All! Toward Universal Visual Question Answering Models》重点翻译+扩展

The projector F is modeled as a 4-layer MLP with 1024 units with swish non-linear activation functions [45].投影F是一个四层MLP,有1024个单元,并且具有swish非线性激活函数。注释:1.MLP:感知机是神经网络(深度学习)的起源算法,是一个包含若干个输入和一个输出的...

2019-11-05 10:40:27 515

原创 深度学习-DRGAN对抗神经网络生成动漫头像

动漫头像素材,项目中新建data文件夹放进去 具体思路是,生成器是将一个噪点生成一副假图片,然后将假图片传给判别器进行判断,如果判别器判断为真,则代码生成器性能很好,而判别器是从真实图片中学习模型,对生成的假图片进行判断,如果判断出来为假则代码判别器性能很好。关于代码的具体注释已经写上,需要单独开博客讲的内容在前几篇博客里写了,直接上代码吧:train.py主运行页面:...

2019-10-31 16:47:11 3554 1

原创 深度学习-逆卷积神经网络ConvTranspose2d

卷积神经网络Conv2d是对图片进行下采样,图片越来越小,而逆卷积神经网络ConvTranspose2d是对图片进行上采样,图片越来越大,卷积与逆卷积是互相对应的。 首先,不管stride等于几,卷积公式都为,逆卷积公式为(注意这个p和s是对应的卷积操作的p和s)。1.当stride=1时:卷积操作:由图片得知,i=4,o=2,k=3,s=1,p=...

2019-10-31 08:49:40 1736

原创 深度学习-Batch normalization的理解

进行多次的数据处理后,可能会导致数据分布不均匀,不同特征值的重要程度不同,比如:左图中w1特征影响较大,w2特征影响较小,所以再进入最中间椭圆后,w2方向几乎不怎么变动了,并且在椭圆的不同位置到达圆心的距离相差很大。而在右图中,圆上同圈内不同位置的点到达圆心的距离是相等的,w1和w2同等重要。所以需要对数据进行归一化,比如normalization 归一化,将数据转换成(0,1)之间...

2019-10-30 17:14:50 196

原创 PyTorch-Tensor基础操作

首先导入import torch as t1.指定tensor形状(随即输出,数值取决于内存空间的状态):a=t.Tensor(2,3)print(a)2.tensor相加:a=t.Tensor([[1,2,3],[1,2,3]])b=t.Tensor([[1,2,3],[1,2,3]])print(a.add(b)) #结果保存到新的tensor中pri...

2019-10-27 16:39:22 2575

原创 论文-《MUREL: Multimodal Relational Reasoning for Visual Question Answering Remi》笔记

重点翻译拓展摘要: 如今在涉及真是图像的VQA任务中,多模态注意力网络时性能最好的,但是这种简单的机制不足以对复杂的推理特征或者高层次的任务进行建模。因此,我们提出了MuRel,一个能在真实图像中学习端到端推理的多模态关系网络。我们的贡献主要有两个:一是引入了MuRel单元,一种通过丰富的向量表示来对问题和图像区域间的交互进行自动推理,和对成对结合区域关系进行建模的结构;二是...

2019-10-26 08:28:33 1793

原创 论文-《MUREL: Multimodal Relational Reasoning for Visual Question Answering Remi》重点翻译+扩展

论文笔记Multimodal attentional networks are currently state-of-the-art models for Visual Question Answering (VQA) tasks involving real images.多模态注意力网络是目前最先进的涉及真实图像的VQA任务模型。In this paper, we propo...

2019-10-25 18:48:49 676

原创 深度学习-ResNet18模型分类CIFAR10数据集详解

简介:首先,ResNet是何凯明大神在2015年提出的,该模型提出后立刻引起轰动。因为在传统卷积神经网络中,当深度越来越深,就会出现梯度消失或者梯度爆炸等问题,从而使准确率降低。结构理解:残差块的短路部分被称作Shortcut Connection,单个残差块的期待输出为H(x),H(x)是由传统卷积层的输出F(x)加短路部分携带的初始数据x求得。特征变换:为了...

2019-10-24 22:42:16 7392 1

原创 深度学习-LSTM与GRU的简单理解

前边我们讲了关于CNN的理解,但是CNN并没有以及能力,所以只能处理一种特定的视觉任务,没法根据以前的记忆来处理新的任务。循环神经网络RNN(Recurrent Neural Network)的提出便是基于记忆模型的想法,期望网络能够记住前面出现的特征,并依据特征推断后面的结果,而且整体的网络结构不断循环,因而得名循环神经网络。循环神经网络目前使用最多的两种变式:LSTM和GRU。传统RN...

2019-10-17 10:45:28 619

原创 深度学习-使用PyTorch分类CIFAR10数据集

十月一前老师布置的任务,让对这个数据集进行分类,我使用的CNN,贴的代码事三层卷积+四层全连接,这几天试了四层卷积和两层全连接以及修改参数的各种混搭组合,就是CPU跑一次数据集太慢了,随机取样那段代码整理的出错,就只能一次性跑全部图片,大概一个多小时才能跑完,心累。训练情况:运行效果:代码:import torchimport torchvisionimport to...

2019-10-17 10:33:27 2265

原创 论文-《Bottom-Up and Top-Down Attention for Image Captioning and Visual Question Answering 》笔记

重点翻译拓展论文下载主题:我们提出将自顶向下和自底向上的注意力机制融合起来,从对象层面计算图像的显著区域。正文:1.新方法的概要过程:自底向上机制(基于Faster R-CNN)提取图像区域,每一个区域关联一个特征向量,自顶向下机制定义特征权重(就是该特征的重要程度)。2.VQA和Image captioning通常使用什么样的方法,有什么缺陷:VQA和Image ...

2019-10-17 08:49:26 456

原创 论文-《Bottom-Up and Top-Down Attention for Image Captioning and Visual Question Answering 》重点翻译+扩展

论文笔记论文下载摘要Abstract Top-down:Top-down visual attention mechanisms have been usedextensively in image captioningand visual question answering (VQA) to enable deeper image understanding through f...

2019-10-16 17:23:13 720

原创 深度学习-卷积神经网络CNN的理解

卷积神经网络的基本形式:卷积神经网络的原理:1.局部性对于一张图片而言,需要检测图片中的特征来决定图片的类别,通常情况下这些特征都不是由整张图片决定的,而是由一些局部的区域决定的。2.相同性对于不同的图片,如果他们具有相同的特征,这些特征会出现在图片的不同的位置,也就是说可以用相同的检测模式取检测不同的图片特征。3.不变性对于一张图片,如果我们进行下采...

2019-10-13 15:23:31 585

原创 深度学习-Sigmoid函数和Softmax函数

1.Sigmoid函数:定义:Sigmoid函数是一个在生物学中常见的S型函数,也称为S型生长曲线。在信息科学中,由于其单增以及反函数单增等性质,Sigmoid函数常被用作神经网络的激活函数,将变量映射到0,1之间,一般用来做二分类。公式:图像:特点:当x趋近于负无穷时,y趋近于0;当x趋近于正无穷时,y趋近于1;当x= 0时,y=0.5。优点:sigmoi...

2019-10-12 20:20:45 2007

原创 深度学习-使用PyTorch显示CIFAR10图像及RGB通道亮度图

目标效果:代码:import numpy as npimport torchfrom torchvision import datasetsimport torchvision.transforms as transformsfrom torch.utils.data.sampler import SubsetRandomSamplerimport matplot...

2019-10-12 11:28:41 2570 1

原创 论文-《Visual Question Answering A tutorial》笔记

重点翻译拓展论文下载主题:本文主要介绍了该领域正在进行的工作以及基于深度学习的VQA如今的方法。正文:1.研究VQA的原因:(1)计算机视觉方面,需要根据算法从图像中提取高水平的数据并进行推理分析,VQA作为最初图灵测试或者图像字幕的替代任务出现。(2)VQA如果发展成熟,可以独立应用于生活。2.VQA答案形式:(1)开放式回答,包含了较为复杂句式,...

2019-10-11 20:59:53 454

原创 论文-《Visual Question Answering A tutorial》重点翻译+扩展

论文笔记论文下载摘要Abstract:Tremendous advances have been seen in the field of computer vision due to the success of deep learning, in particular on low- and midlevel tasks, such as image segmentation or...

2019-10-11 18:30:52 1481

原创 python-matplotlib库的基本用法(二)

导入的库同上一篇一样:import matplotlib.pyplot as pltimport numpy as npfrom mpl_toolkits.mplot3d import Axes3Dimport matplotlib.gridspec as gridspec示例8:n=1024x=np.random.normal(0,1,n)y=np.random.n...

2019-08-26 20:29:33 303

原创 python-matplotlib库的基本用法(一)

导入基本的库:import matplotlib.pyplot as pltimport numpy as npfrom mpl_toolkits.mplot3d import Axes3Dimport matplotlib.gridspec as gridspec示例1:x=np.linspace(-1,1,50) #(-3,3)平分50个点y=2*x+1 ...

2019-08-26 20:14:11 1804

原创 深度学习-GAN生成式对抗网络

生成式对抗网络(GAN,generative adversarial network)的简单理解就是,想想一名伪造者试图伪造一幅毕加索的画作。一开始,伪造者非常不擅长这项任务,他随便画了幅与毕加索真迹放在一起,请鉴定商进行评估,鉴定商鉴定后,将结果反馈给伪造者,并告诉他怎样可以让❀看起来更像毕加索的真迹。伪造者学习后回去重新画,然后再拿给鉴定商鉴定,多次循环后,伪造者已经十分熟练的伪造毕加索的画作...

2019-07-31 16:07:22 415

原创 深度学习-自编码 (Autoencoder)转换MNIST图像数据集

关于自编码 (Autoencoder),可见但理解为,当输入信息的信息量比较大时,神经网络直接从大量信息中学习是很复杂一件事,但是如果将信息进行压缩,保留关键部分,神经网络学习起来就比较轻松了,等到学习完,可以将信息解压,对比正确率,然后不断地反向传播进行修改权重。下面的例子是将MNIST图片进行压缩后解压:import torchimport torch.nn as nnimp...

2019-07-31 12:41:08 792

原创 深度学习-使用RNN-LSTM分类MNIST数据集

传统CNN有一个主要特点,就是没有记忆,他们单独处理每个输入,在输入和输入之间没有保存任何状态,对于这样的网络,有些事是无法较好实现的。比如像阅读一篇文章或者一个句子,需要不断地对输入信息进行整合理解,才能更好的解决问题,这时候就需要用到RNN(循环神经网络)。RNN简单理解就是一个序列当前的输出与前面的输出也有关。具体的表现形式为网络会对前面的信息进行记忆并应用于当前输出的计算中,即隐藏层之...

2019-07-30 17:24:10 1076

原创 深度学习-使用CNN分类MNIST数据集

参考莫烦大神的视频,视频中没有讲最后的动画演示,他github中有,但是一是数据太大笔记本一运行就卡,二是绘制那部分代码看不懂,所以我删掉了,只是简单运行显示下正确率。import torchimport torch.nn as nnimport torchvisionimport torch.utils.data as Dataimport matplotlib.pyplot as...

2019-07-30 11:22:06 903

原创 深度学习-Optimizer优化器的比较

深度学习中常用的优化器一般有如下几种:BGD(批量梯度下降法,Batch Gradient Descent):是最原始的形式,它是指在每一次迭代时使用所有样本来进行梯度的更新。 优点:由全数据集确定的方向能够更好地代表样本总体,从而更准确地朝向极值所在的方向。当目标函数为凸函数时,BGD一定能够得到全局最优。 缺点:当样本数目 mm 很大时,每迭代一步都需要对所有样本计算,训练过...

2019-07-29 16:26:49 513

数据结构-栈的链式存储

栈的链式存储栈的链式存储栈的链式存储栈的链式存储栈的链式存储

2017-09-29

线性表链式存储

线性表的链式存储线性表的链式存储线性表的链式存储线性表的链式存储线性表的链式存储

2017-09-29

数据结构-线性表的顺序存储

线性表的顺序存储线性表的顺序存储线性表的顺序存储线性表的顺序存储线性表的顺序存储线性表的顺序存储线性表的顺序存储

2017-09-17

Android-邮箱验证

输入邮箱获取验证码进行验证

2017-08-21

邮箱验证资源

邮箱验证jar包,java类

2017-08-21

Android-语音录音以及播放

两种语音处理格式,一种是文件格式,一种是字符流格式

2017-06-21

Android-拼图小游戏

基于Android的简易拼图游戏

2017-06-20

Android-LineChart图标显示多条曲线

使用LineChart,显示多条曲线

2017-04-13

Android-拍照并跳转到另外的activity

第一个activity拍照后,第二个activity显示

2017-04-11

Android-简易弹钢琴

Android简易版七键钢琴

2017-04-10

Android-简易打地鼠

基于Android的简易版打地鼠

2017-04-10

Android-打地鼠

Android-打地鼠

2017-04-10

Android-涂鸦板

可以进行更换笔的粗细,笔的颜色,清空,保存

2017-04-08

Android-图片填色

可以随机填色,或者选择颜色进行填色

2017-04-08

Easyx2048小游戏

使用Easyx+C语言编写的2048小游戏。

2017-01-17

Easyx贪吃蛇

使用Easyx+C语言编写的贪吃蛇小游戏

2017-01-17

Walker(二)素材包

Walker注册使用到的图片。

2017-01-17

Walker(四)

Walker添加导航页面

2017-01-17

Walker(三)

Walker注册页面添加校验。

2017-01-17

walker(五)

Walker添加侧滑菜单

2017-01-16

人脸识别资源文件压缩包.rar

人脸识别资源文件人脸识别资源文件人脸识别资源文件人脸识别资源文件人脸识别资人脸识别资源文件源文件人脸识别资源文件

2020-05-16

MNIST数据集.rar

MNIST数据集

2020-04-27

WordsProject.rar

python词频统计

2019-11-30

使用RNN写诗.rar

RNN写诗《深度学习框架PyTorch:入门与实践》 RNN写诗《深度学习框架PyTorch:入门与实践》

2019-11-15

DRGAN动漫头像faces.rar

DRGAN动漫头像,

2019-10-31

CVPR2018.pdf

Bottom-Up and Top-Down Attention for Image Captioning and Visual Question Answering

2019-10-16

Visual Question Answering A Tutorial.pdf

视觉问答VQA综述论文,2017 。视觉问答VQA综述论文,2017

2019-10-11

testSet.rar

Logistic回归,基于最优化方法的最佳回归系数确定,数据包

2019-07-18

朴素贝叶斯邮箱识别email.rar

朴素贝叶斯中邮箱识别数据包,朴素贝叶斯中邮箱识别数据包。

2019-07-17

数字识别.rar

K近邻算法手写数字识别系统数据,K近邻算法手写数字识别系统数据。

2019-07-15

datingTestSet.rar

K近邻算法海伦约会数据文档

2019-07-15

Cisco-综合实验网络拓扑结构

Cisco实验 搭建好的网络拓扑结构,未进行设置。。。。

2017-12-17

数据结构-非递归遍历二叉树

数据结构非递归先序、中序、后序遍历二叉树,数据结构非递归先序、中序、后序遍历二叉树

2017-11-16

数据结构-哈夫曼树的实现

数据结构哈夫曼树的实现,数据结构哈夫曼树的实现,数据结构哈夫曼树的实现

2017-11-16

数据结构-二叉树算法拓展

二叉树拓展算法,比如交换左右子树,二叉链表完全二叉树转换为顺序结构,求最大结点值

2017-11-12

数据结构-二叉树遍历

二叉树的前序、中序、后序、层次等基本遍历,二叉树的前序、中序、后序、层次等基本遍历

2017-11-05

数据结构-一元多项式

数据结构-一元多项式象加、减、乘、求导、积分,数据结构-一元多项式象加、减、乘、求导、积分

2017-10-26

数据结构-循环队列

数据结构顺序存储循环队列,数据结构顺序存储循环队列

2017-10-19

数据结构-栈进制转换和括号匹配

使用栈进行进制转换和括号匹配 使用栈进行进制转换和括号匹配

2017-10-14

数据结构-栈的顺序存储

数据结构-栈的顺序存储

2017-10-14

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除