机器学习
玉兔金兔
这个作者很懒,什么都没留下…
展开
-
Standford CS231n 循环神经网络 简要笔记
循环神经网络笔记 (Stanford CS231n)循环神经网络与卷积神经网络区别:卷积神经网络需要固定长度的输入和输出,循环神经网络可以是不定长的输入。卷积神经网络就是下图的一对一实例图,其余几个都是循环神经网络的示意图。one to many :输入一个图片,输出一句描述图片的话。many to one :输入一句话,判断是正面还原创 2017-02-23 21:56:44 · 2464 阅读 · 0 评论 -
StyleBank: An Explicit Representation for Neural Image Style Transfer 论文理解
StyleBank: An Explicit Representation for Neural Image Style Transfer论文理解与现有的神经风格转换网络区别:(1)给风格提供了一个明显的表示。网络在训练好之后可以从内容中完全分离出样式。(2)能够基于区域的风格转换。(3)不仅可以同时训练多个共享自编码的风格,还可以在不改变自编码的情况下,增量学原创 2017-07-19 22:12:37 · 5351 阅读 · 2 评论 -
Inverting Convolutional Networks with Convolutional Networks 论文理解
Inverting Convolutional Networks with Convolutional Networks 论文创新点:(1)提出了一个前向生成图像网络(上卷积网络)。相比于之前的梯度下降优化方式提高了速度,基本能达到实时。(2)提出了新的损耗计算方式。图像之间的距离损耗。之前是采用最小化特征的距离,这种损耗会有这样的弊端:不同的图像映射的feat原创 2017-06-14 21:11:05 · 709 阅读 · 0 评论 -
Inverting Visual Representations with Convolutional Networks论文理解
Inverting Visual Representations with Convolutional Networks论文理解这篇论文涉及两种特征进行图像重建:(1)传统的计算机视觉图像特征:HOG、SIFT、BLP (Shallow features)(2)AlexNet的每层特征 (AlexNet)Shallow features原创 2017-06-16 20:43:58 · 849 阅读 · 0 评论 -
A Neural Algorithm of Artistic Style 论文理解
A Neural Algorithm of Artistic Style 论文理解 卷积网络的每个卷积层重构图像:越高层重构出的图像布局一致,但具体像素值不准确,越低层的卷积层重构出来的图像的像素值越准确。在风格化这块需要大的布局一致,但是不需要精准像素,所以用高层的feature map表示content信息。 输入图像的sty原创 2017-05-09 21:18:38 · 1162 阅读 · 0 评论 -
Multi-style Generative Network for Real-time Transfer论文理解
Multi-style Generative Network for Real-time Transfer创新点: (1)提出了一个Inspiration layer,用于匹配风格图片的特征统计信息(Gram 矩阵)并保留content的内容。 (2)提出了一个新的前向网络,采用了残差网络。主要点在多个尺度上(4个尺原创 2017-04-26 20:57:43 · 3288 阅读 · 5 评论 -
The Linear Monge-Kantorovitch Linear Colour Mapping for Example-Based Colour Transfer 论文理解
The Linear Monge-Kantorovitch Linear Colour Mapping for Example-Based Colour Transfer论文理解 背景:图像编辑中调色是很常用的,一点颜色差别就能造成照片的整体风格相差很大;在视频电影拍摄中也比较常用,譬如统一时间不同的光线拍出的感觉是有很大差别的。早期有直接使用一对一颜色映射的方式原创 2017-05-26 21:47:03 · 1246 阅读 · 0 评论 -
Fast Patch-based Style Transfer of Arbitrary Style论文理解
创新点: 这篇论文实现了图像的任意风格转换,不在局限于单个风格的训练。同时支持优化和前向网络的方法。这个方面只在一层进行相关处理。style swap 表示content在某一层的feature maps、表示style在某一层的feature maps。 ,就是表示用对应的代替后的值。具体怎么替换,采用的是基于块的方式,先确定块的大原创 2017-04-22 20:53:14 · 5563 阅读 · 3 评论 -
Arbitrary Style Transfer in Real-time with Adaptive Instance Normalization论文理解
在这之前只有Fast Patch-based Style Transfer of Arbitrary Style这篇论文是实现任意风格的,然而这篇论文的实现效果并不是很好,处理的结果很像是两张图融合的效果,风格信息保留的不算多,风格特征不明显;另一个很重要的问题是速度比较慢,由于这篇论文的网络核心部分是一个style swap layer,即在这一层,对content的feature maps的每原创 2017-04-19 20:59:51 · 10519 阅读 · 2 评论 -
机器学习torch代码训练过程中常见bug解决经验
1.out of memory THCudaCheck FAIL file=/tmp/luarocks_cutorch-scm-1-3726/cutorch/lib/THC/generic/THCStorage.cu line=66 error=2 : out of memoryIn 20 module of nn.Sequential:……torch/inst原创 2017-05-23 21:50:27 · 23411 阅读 · 1 评论 -
Tensorflow cnn网络 vgg可视化
1 安装 tf_cnnvis https://github.com/InFoCusp/tf_cnnvis2 使用tensorboard查看结果,(如果不能运行ipynb,可以直接将内容拷贝出成.py 运行)3 vgg19 的可视化# -*- coding: utf-8 -*-import osimport syssys.path.append(os原创 2017-04-20 23:24:45 · 4583 阅读 · 10 评论 -
A Learned Representation for Artistic Style论文理解
A Learned Representation for Artistic Style论文理解这篇论文是在Perceptual losses for real-time style transfer and super-resolution的基础上提出了更灵活的风格迁移模型,Justin 提出的模型解决了训练单一风格的耗费时间比较长的问题,提出了一个图像转换网络和图像损耗网络的概念,训原创 2017-03-26 10:17:36 · 6795 阅读 · 1 评论 -
Tensor数据相关的运算及函数讲解
Tensor数据相关的运算及函数讲解Tensortensorflow 中使用它来表示数据。可以看做多维数组或者list。标量是张量,向量是张量,矩阵是张量,矩阵的矩阵是张量常用几种定义方法1.variable变量,一般是可以被更更新或更改的数值,即在流图运行过程中可以被不断动态调整的值。我们训练一个模型的时候,会用到Tensorflow中的变原创 2017-03-16 22:40:00 · 35744 阅读 · 6 评论 -
torch神经网络包 nn
torch神经网络包 nny = torch.func(x,…)等价于y = x:func(…),就是说如果用”torch”,那么“src”是第一个参数。否则就”src:”神经网络训练正常有5步:1.加载数据2.定义网络 nn.Sequential3.定义损失函数 nn.ClassNLLCriterion 等等原创 2017-03-30 21:19:53 · 1146 阅读 · 0 评论 -
A Hierarchical Deep Convolutional Neural Network for Fast Artistic Style Transfer论文理解
A Hierarchical Deep Convolutional Neural Network for Fast Artistic Style Transfer论文理解现有的网络有两个主要问题:1.用于训练前向网络的style图片的分辨率都是固定的,这样会导致不同的分辨率出来的艺术效果差别比较大,容易匹配错误尺寸的风格图。2.当前的网络捕获不到小的原创 2017-04-10 23:20:45 · 1208 阅读 · 0 评论 -
使用vgg19模型进行图片识别
目标:1 使用vgg网络识别以下图片,识别结果中最大概率5分类名称和概率值是什么?2 使用A图片输入vgg, 将其最后一层卷积网络 relu maxpool 生成的特征map 按激活度排序,保存激活度最高的4张为png。请将处理的代码和结果回复到此贴资源准备:1.相关的vgg模型下载网址http://www.vlfeat.org/ma原创 2017-03-29 22:10:45 · 28209 阅读 · 2 评论 -
Perceptual Losses for Real-Time Style Transfer and Super-Resolution 论文 理解
斯坦福 大学的一篇基于感知损失函数的实时风格转换和超分辨重建暂时只对实时风格转换部分做了理解,记录如下,如有问题,欢迎指正。这篇论文解决了之前Gatys等人实现的风格转换费时比较久的问题。训练了一个网络,其中直接包含前向生成部分,等模型训练好了可以直接用于生成转换图片。这个网络与之前Gatys的图像生成对比:效果是差不多(个人觉得有些地方稍差点:感觉物体大部分分割比ga原创 2017-02-22 22:07:51 · 16836 阅读 · 12 评论 -
ZM-Net: Real-time Zero-shot Image Manipulation Network 论文理解
ZM-Net: Real-time Zero-shot Image Manipulation Network 论文理解 这篇论文提出了Zero-shot Manipulation Net(ZM-Net),这个网络由两个子网络网络组成,对图像变化网络和参数网络同时优化。其思想是任意一幅图像都根据它的参数模型得到的参数进行处理,这个参数模型是专门根据不同的输入图像信息生成其对应的重要原创 2017-08-01 21:42:33 · 1097 阅读 · 0 评论