2017年12月_c2a2o2

转载中国计算机学会推荐国际学术会议

http://www.ccf.org.cn/xspj/rgzn/https://cmt3.research.microsoft.com/User/Login?ReturnUrl=%2FCVPR2019 prl是模式识别和计算机视觉邻域知名期刊，与之相当的期刊包括ivc，mva，paa，iet-ipr以及iet-cvi等，比之稍好的有tip，cviu以及pr等，顶级期刊是pami和ij...

2017-12-06 13:48:49 1095

转载 PSNR和SSIM

PSNR（Peak Signal to Noise Ratio）峰值信噪比，一种全参考的图像质量评价指标。其中，MSE表示当前图像X和参考图像Y的均方误差（Mean Square Error），H、W分别为图像的高度和宽度；n为每像素的比特数，一般取8，即像素灰阶数为256. PSNR的单位是dB，数值越大表示失真越小。PSNR是最普遍和使用最为广泛的一种图像客观评价指标，

2017-12-29 16:23:16 850

转载《Generative Face Completion》论文笔记

论文用深度生成模型实现了一个高效面部补全算法。与传统从已给数据集中搜寻相似图片块儿来进行补全和合成残缺图片的方法不同，作者是直接使用一个神经网络来合成残缺部分的内容。整个模型由三部分构成：a reconstruction loss、two adversarial losses、a semantic parsing loss。a) 论文目的：传统以复制-粘贴的方式来进行图片补全在背景

2017-12-29 15:08:13 3112 1

转载 Photo-Realistic Single Image Super-Resolution Using a Generative Adversarial Network

Photo-Realistic Single Image Super-Resolution Using a Generative Adversarial NetworkLedig C, Theis L, Huszar F, et al. Photo-Realistic Single Image Super-Resolution Using a Generative Adversarial

2017-12-29 14:04:41 12484

转载《Photo-Realistic Single Image Super-Resolution Using a Generative Adversarial Network》阅读笔记

Abstract尽管我们已经利用更快更深的卷积神经网络(CNN)突破了单一图像超分辨率的速度和精度，但有一个中心问题仍没有完美解决：当对放大很多倍的图像进行超分辨率时，我们该如何更好的恢复图像的纹理细节？以最优化思想为基础的超分辨率方法主要受到目标函数的驱使，最近的一些相关项目均以最小化平均方差重建误差为目标，这样得到的结果有很大的信噪比，但是往往图像会缺失高频细节并且视觉效果很差。

2017-12-29 13:58:59 315

转载你竟然还不懂变分自编码机？这个16岁的OpenAI天才实习生讲得可透彻了

你知道啥叫变分自编码机吗？你知道为啥你需要懂变分自编码机呢？你知道如何以最快的速度搞懂变分自编码机吗？啥也不说了，还是让这位16岁的天才少年讲给你听吧。Kevin Frans是加州Palo Alto的一名高中生，他年级轻轻便已写出两篇论文，并且对生成式模型颇有研究。他的成名作是一个名为deepcolor的项目。现在，他正在以实习生的身份在OpenAI做强化学

2017-12-28 17:21:55 454

转载三大深度学习生成模型：VAE、GAN及其变种

本章将为读者介绍基于深度学习的生成模型。前面几章主要介绍了机器学习中的判别式模型，这种模型的形式主要是根据原始图像推测图像具备的一些性质，例如根据数字图像推测数字的名称，根据自然场景图像推测物体的边界；而生成模型恰恰相反，通常给出的输入是图像具备的性质，而输出是性质对应的图像。这种生成模型相当于构建了图像的分布，因此利用这类模型，我们可以完成图像自动生成（采样）、图像信息补全等工作。在深度

2017-12-28 16:11:41 1370 1

转载 matplotlib命令与格式：图像(figure)与子区域(axes)布局与规划

1.figure语法及操作(1)figure语法说明figure(num=None, figsize=None, dpi=None, facecolor=None, edgecolor=None, frameon=True)num:图像编号或名称，数字为编号，字符串为名称figsize:指定figure的宽和高，单位为英寸；dpi参数指定绘图对象的分辨率，即每英寸多少

2017-12-25 16:59:47 1325

转载看得“深”、看得“清” —— 深度学习在图像超清化的应用

日复一日的人像临摹练习使得画家能够仅凭几个关键特征画出完整的人脸。同样地，我们希望机器能够通过低清图像有限的图像信息，推断出图像对应的高清细节，这就需要算法能够像画家一样“理解”图像内容。至此，传统的规则算法不堪重负，新兴的深度学习照耀着图像超清化的星空。本文首发于《程序员》杂志12 图1. 最新的Pixel递归网络在图像超清化上的应用。左图为低清图像，右图为其对应的高清图像

2017-12-20 16:08:40 2366

最近，谷歌发布了一种把低分辨率图像复原为高分辨率图像的方法，参见机器之心文章《》。与最先进的方法相比，这篇论文提出了一种端到端的框架来完成超分辨率任务。它由两个卷积神经网络组成，一个是描述低分辨率图像骨架的优先网络（prior network），一个是用于优化细节特征的调节网络（conditioning network）。这种方法强调了细节特征恢复上的提升，并以概率范式（probabilistic

2017-12-20 15:47:02 3820

转载 tf9: PixelCNN

前一帖生成音乐，本帖生成图片。本文使用TensorFlow实现论文《Conditional Image Generation with PixelCNN Decoders》，它是基于PixelCNN架构的模型，最早出现在《Pixel Recurrent Neural Networks》一文。使用的图片数据我本想使用ImageNet做为图片来源，就像论文中使用的。ImageN

2017-12-20 14:59:17 557

转载生成对抗网络(GAN)的理论与应用完整入门介绍

本文包含以下内容：1.为什么生成模型值得研究2.生成模型的分类3.GAN相对于其他生成模型相比有什么优势4.GAN基本模型5.改进的GANs6.GAN有哪些应用7.GAN的前沿研究一、为什么生成模型值得研究主要基于以下几个原因：1. 从生成模型中训练和采样数据能很好的测试我们表示和操作高维概率分布的能力。

2017-12-18 14:37:47 1660

转载 GAN完整理论推导与实现，Perfect！

本文是机器之心第二个 GitHub 实现项目，上一个 GitHub 实现项目为从头开始构建卷积神经网络。在本文中，我们将从原论文出发，借助 Goodfellow 在 NIPS 2016 的演讲和台大李弘毅的解释，完成原 GAN 的推导、证明与实现。本文主要分四部分，第一部分描述 GAN 的直观概念，第二部分描述概念与优化的形式化表达，第三部分将对 GAN 进行详细的理论推导与分析，最后

2017-12-18 14:34:38 858

转载 AI-图书馆（一）

Deep Learning（深度学习）：ufldl的2个教程(这个没得说，入门绝对的好教程，Ng的，逻辑清晰有练习)：一ufldl的2个教程(这个没得说，入门绝对的好教程，Ng的，逻辑清晰有练习)：二Bengio团队的deep learning教程，用的theano库，主要是rbm系列，搞python的可以参考，很不错。deeplearning.net主页，里面包含

2017-12-18 13:51:34 838

转载最小二乘GAN：比常规GAN更稳定，比WGAN收敛更迅速

LSGANs基本思想LSGANs的英文全称是Least Squares GANs。这篇文章针对的是标准GAN生成的图片质量不高以及训练过程不稳定这两个缺陷进行改进。改进方法就是将GAN的目标函数由交叉熵损失换成最小二乘损失，而且这一个改变同时解决了两个缺陷。为什么最小二乘损失可以提高生成图片质量？我们知道，GANs包含两个部分：判别器和生成器。判别器用于判断一张图片是来自真实

2017-12-18 09:53:06 2500

转载谷歌开放语音命令数据集，助力初学者利用深度学习解决音频识别问题

语音命令数据集地址：http://download.tensorflow.org/data/speech_commands_v0.01.tar.gz音频识别教程地址：https://www.tensorflow.org/versions/master/tutorials/audio_recognition在谷歌，我们经常被问到如何使用深度学习解决语音识别和其他音频识别问

2017-12-17 08:57:01 4360 1

转载 julius开源语音识别引擎

开源语音识别软件HTK，对Julius和 Kaldi等系统了解者更佳一.Installation By Source tarballInstallation process is simple and contains the following points:1. Download the newest source tarbal from

2017-12-16 22:21:53 1317

转载 kaldi上第一个免费的中文语音识别例子

今天在清华大学cslt实验室王东老师的分享下，kaldi终于有了免费的中文语音识别的例子，网址为：https://github.com/kaldi-asr/kaldi/tree/master/egs/thchs30。各位可以根据这个来训练自己的模型。再次谢谢王东老师的付出。此外，清华大学cslt分享的数据库还有很多，网址为：http://pan.baidu.com/s/1dEhUghz

2017-12-16 22:19:23 1072

转载 DeepMind发布最新原始音频波形深度生成模型WaveNet，将为TTS带来无数可能

WaveNets是一种卷积神经网络，能够模拟任意一种人类声音，生成的语音听起来比现存的最优文本-语音系统更为自然，将模拟生成的语音与人类声音之间的差异降低了50%以上。我们也将证明，同一种网络能够合成其他音频信号，如音乐，并能够自动生成沁人心脾的钢琴曲。会说话的机器使人们能够与机器自由交谈是人机交互研究领域长久以来的梦想。过去几年中，深度神经网络的应用（如Google语音搜

2017-12-16 20:53:51 1194

转载 tf17: “声音大挪移”

看见本帖标题，你可能会问：“声音大挪移”是什么鬼玩意，和张无忌有什么关系。如果你没看过鬼畜，先温习两个：【元首】粉红的回忆、【圣地亚哥金曲】客官不可以。（本帖内容和鬼畜关系不大）前文《实现谷歌Deep Dream》可生成带有艺术感的图片。其实，还有另一种合成图片的方式，洋文叫Style Transfer，这种方法需要用到两张图片，如下图： + = 皮特 + St

2017-12-16 17:20:34 368

转载随机器学习兴起的Julia编程语言

Julia这个编程语言即有Python的开发效率，也有C的执行效率，是为数值运算设计的编程语言。Julia可以直接调用C，很多开源的C和Fortran库都集成到了Julia基础库。另外，它也有notebook。Julia试图取代R, MATLAB, Octave等数值计算工具。其语法与其他科学计算语言相似。在许多情况下拥有能与编译型语言相媲美的性能。Julia的设计遵从三个原则，快、表达式

2017-12-16 17:17:47 1327

转载深度学习在单图像超分辨率上的应用：SRCNN、Perceptual loss、SRResNet

单图像超分辨率技术涉及到增加小图像的大小，同时尽可能地防止其质量下降。这一技术有着广泛用途，包括卫星和航天图像分析、医疗图像处理、压缩图像/视频增强及其他应用。我们将在本文借助三个深度学习模型解决这个问题，并讨论其局限性和可能的发展方向。我们通过网页应用程序的形式部署开发结果，允许在自定义图像上测试文中的大多数方法，同样你也可以查看我们的实例：http://104.155.157.132:

2017-12-13 11:30:06 8057

转载不可错过的 GAN 资源：教程、视频、代码实现、89 篇论文下载

NIP 2016 对抗训练 Workshop　　【网页】https://sites.google.com/site/nips2016adversarial/　　【博客】http://www.inference.vc/my-summary-of-adversarial-training-nips-workshop/　　教程 & 博客如何训练 GAN？

2017-12-13 10:52:24 2958

转载 GAN的基本原理与入门应用！

生成对抗网络（GAN）是一类在无监督学习中使用的神经网络，其有助于解决按文本生成图像、提高图片分辨率、药物匹配、检索特定模式的图片等任务。Statsbot 小组邀请数据科学家 Anton Karazeev 通过日常生活实例深入浅出地介绍 GAN 原理及其应用。生成对抗网络由 Ian Goodfellow 于 2014 年提出。GAN 不是神经网络应用在无监督学习中的唯一途径，还

2017-12-13 10:40:10 825

转载 GAN的基本原理、应用和走向

近年来，基于数据而习得“特征”的深度学习技术受到狂热追捧，而其中GAN模型训练方法更加具有激进意味：它生成数据本身。GAN是“生成对抗网络”（Generative Adversarial Networks）的简称，由2014年还在蒙特利尔读博士的Ian Goodfellow引入深度学习领域。2016年，GAN热潮席卷AI领域顶级会议，从ICLR到NIPS，大量高质量论文被发表和探讨。Yann L

2017-12-13 10:16:46 1178

转载如何使用TensorFlow和VAE模型生成手写数字

全部 VAE 代码：https://github.com/FelixMohr/Deep-learning-with-Python/blob/master/VAE.ipynb自编码器是一种能够用来学习对输入数据高效编码的神经网络。若给定一些输入，神经网络首先会使用一系列的变换来将数据映射到低维空间，这部分神经网络就被称为编码器。然后，网络会使用被编码的低维数据

2017-12-10 21:50:05 629

转载 TensorFlowSharp入门使用C#编写TensorFlow人工智能应用

TensorFlowSharp入门使用C#编写TensorFlow人工智能应用学习。TensorFlow简单介绍TensorFlow 是谷歌的第二代机器学习系统，按照谷歌所说，在某些基准测试中，TensorFlow的表现比第一代的DistBelief快了2倍。TensorFlow 内建深度学习的扩展支持，任何能够用计算流图形来表达的计算，都可以使用TensorFlow。

2017-12-10 19:33:22 2150

转载 VAE(Variational Autoencoder)的原理

Kingma, Diederik P., and Max Welling. "Auto-encoding variational bayes." arXiv preprint arXiv:1312.6114 (2013).论文的理论推导见：https://zhuanlan.zhihu.com/p/25401928中文翻译为：变分自动编码器转自：http://kvfrans.com/va

2017-12-08 21:48:11 709

转载 TensorFlow学习笔记之五——源码分析之最近算法

[python] view plain copyimport numpy as np import tensorflow as tf # Import MINST data import input_data mnist = input_data.read_data_sets("/tmp/data/", one_hot=True)

2017-12-08 21:44:32 216

转载只知道GAN你就OUT了——VAE背后的哲学思想及数学原理

短短三年时间，变分编码器VAE（Variational Auto-encoder）同GAN一样，成为无监督复杂概率分布学习的最流行的方法。VAE之所以流行，是因为它建立在标准函数逼近单元，即神经网络，此外它可以利用随机梯度下降进行优化。本文将解释重点介绍VAE背后的哲学思想和直观认识及其数学原理。VAE的最大特点是模仿自动编码机的学习预测机制，在可测函数之间进行编码、解码。同GAN类似，其

2017-12-08 19:37:36 221

转载 OpenAI探索机器人模拟训练新方法：仿真与真实世界无缝衔接

问耕编译整理OpenAI发布了一项新的机器人技术。研究人员完全在仿真模拟环境中对机器人控制器进行训练，然后把控制器直接应用在实体机器人身上，通过这种方式让机器人在执行简单任务时，可以应对外界环境预料之外的变化。OpenAI已经用这一技术构建了闭环系统，取代原来的开环系统。这个模拟器不需要匹配现实世界的情况，相反，OpenAI对相关环境采用了随机化的设置，包括摩擦力

2017-12-07 21:37:40 3191

转载手抖有救了！DeblurGAN消除运动模糊效果惊人 | 附论文+代码

置身异国街道，感受着陌生环境里熙熙攘攘的街道，你掏出手机想留住这一刻。好嘞，一、二、三，咔嚓。由于行人和车辆都在运动，再加上你的手稍微抖了一抖，照片中的景象是这样的——这样的——和这样的——这是什么AV画质啊！拍照时手抖，或者画面中的物体运动都会让画面模糊，女友辛辛苦苦摆好的各种Pose也将淹没在各种模糊的线条中，是

2017-12-07 21:27:52 2950

转载 tf.nn.softmax_cross_entropy_with_logits()笔记及交叉熵

交叉熵交叉熵可在神经网络(机器学习)中作为损失函数，p表示真实标记的分布，q则为训练后的模型的预测标记分布，交叉熵损失函数可以衡量p与q的相似性。交叉熵作为损失函数还有一个好处是使用sigmoid函数在梯度下降时能避免均方误差损失函数学习速率降低的问题，因为学习速率可以被输出的误差所控制。tensorflow中自带的函数可以轻松的实现交叉熵的计算。tf.nn.softmax_cro

2017-12-07 15:50:32 460

转载基于GANs的图像编辑方法

近些年来，生成对抗网络在许多图像生成和图像编辑任务上都获得了很大的成功，并受到越来越多的关注。对于图像编辑任务，现在面临的两个重要的挑战分别是：如何提升生成图像的质量和如何灵活控制生成图像内容。这次分享的两篇文章，分别对如何解决这两个问题做出了相应的探索。在第一篇文章中，在原有的生成对抗网络的框架下，作者提出了一种新的感知对抗机制，试图从更多角度测量并缩小生成图像和理想结果间的差距，从何获得更好的

2017-12-06 21:38:48 935

转载要让GAN生成想要的样本，可控生成对抗网络可能会成为你的好帮手

如何让GAN生成带有指定特征的图像？这是一个极有潜力、极有应用前景的问题，然而目前都没有理想的方法。韩国大学电子工程学院Minhyeok Lee和Junhee Seok近期发表论文，就生成对抗网络的控制问题给出了自己的办法，AI 科技评论根据原文进行如下编辑。简介生成对抗网络（GANs）是最近几年提出的新方法，在其问世之后的短短时间内，生成对抗网络已经在生成真实的样本上表现出很多有

2017-12-06 21:08:38 1359

转载 GAN生成的结果多样性不足怎么办？那就再添一个鉴别器！

AI科技评论按：近期，澳大利亚迪肯大学图像识别和数据分析中心发表了一篇新的论文，由Tu Dinh Nguyen, Trung Le, Hung Vu, Dinh Phung编写，该论文就生成对抗网络（GAN）的模式崩溃问题进行了讨论并给出了一种新的有效的解决方案 D2GAN，论文译稿由AI 科技评论编辑。原文链接：https://arxiv.org/abs/1709.03831

2017-12-06 20:57:49 2965

转载基于TensorFlow理解三大降维技术：PCA、t-SNE 和自编码器

ythonista 数据科学家 Elior Cohen 近日在 Medium 上发文解读了最常见的三大降维技术：PCA、t-SNE 和自编码器。为了帮助理解，他还为其中每种相关算法编写了代码（也发布在了 GitHub 上）。机器之心对本文进行了编译介绍。代码地址：https://github.com/eliorc/Medium/blob/master/PCA-tSNE-AE.ipynb

2017-12-06 16:19:24 2727

转载 ICLR2018论文投稿抢先看：Ian Goodfellow由衷赞赏的训练稳定方法SN-GANs

大家都知道，ICLR 2018的论文投稿已经截止，现在正在评审当中。虽然OpenReview上这届ICLR论文的评审过程已经放弃了往届的双方身份公开，但仍然比其它会议“open”得多：论文内容、以及评审过程中的读者建议和作者答复都是可见的。随着评审过程持续进行，近期也不断有好的评审中的论文被分享到社交平台上，研究者们得以先睹为快。NVIDIA甚至主动推广了自己投递的一篇论文。这两天

2017-12-06 15:31:17 1320

转载 GANs中的明星StarGAN：使用单一模型执行多个域的图像转换，GAN之父点赞

2017年可谓“GANs之年”，各种基于GANs的模型和变化层出不穷。近日，来自韩国首尔大学、Naver等研究者发布了一篇“StarGAN：Unified Generative Adversarial Networks for Multi-Domain Image-to-Image Translation”的文章，下面AI科技评论和大家来看下这篇论文。论文摘要：最近的研究表明在两个

2017-12-06 15:18:19 2149

转载 PyTorch在64位Windows下的Conda包

昨天发了一篇PyTorch在64位Windows下的编译过程的文章，有朋友觉得能不能发个包，这样就不用折腾了。于是，这个包就诞生了。感谢@Jeremy Zhou为conda包的安装做了测试。更新：已经添加了对所有Compute Capability>=2.0的显卡和老版本Windows的支持更新：已经支持最新的0.2版本，重新键入安装命令即可进行安装或升级先别急着激动。

2017-12-04 14:17:01 340

ffmpeg-4.2.1-win64-win10-然后pip就好

dlib安装 dlib-19.19.0-cp38-cp38-win_amd64.whl.whl

dlib-19.17.99-cp37-cp37m-win_amd64.whl

coreseek-4

空空如也