自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

原创 深度学习(四十五)——Stack GAN, GAN Ensemble, Pix2Pix, CycleGAN

Stack GAN 论文: 《StackGAN: Text to Photo-realistic Image Synthesis with Stacked Generative Adversarial Networks》 早期以DCGAN为代表的网络生成的图片分辨率太低,质量不够好,都不超过100...

2020-05-25 09:59:48 9 0

原创 深度学习(四十四)——GAN的评估指标, DCGAN, WGAN-GP, CGAN, BEGAN & EBGAN

GAN的评估指标 尽管可用的GAN模型非常多,但对它们的评估仍然主要是定性评估,通常需要借助人工检验生成图像的视觉保真度来进行。此类评估非常耗时,且主观性较强、具备一定误导性。鉴于定性评估的内在缺陷,恰当的定量评估指标对于GAN的发展和更好模型的设计至关重要。 论文: 《An empirical ...

2020-05-18 10:13:30 299 0

原创 Ubuntu使用技巧(三), 硬盘安装Linux(UEFI)

VNC vino & remmina ubuntu不同于一般的发行版,它对桌面做了很大的改动,因此通常的VNC手段对其并不好使。 但其实它已经自带了相关的应用: 服务端:vino 设置->共享->屏幕共享,设置密码并打开。 ss -lnt查看5900端口是否开启。 设置防火...

2020-04-27 11:23:31 108 0

原创 C/C++编程心得(三)

各类ptr auto_ptr:它允许程序员创建一个指向某种资源的指针对象,当该对象离开它的作用域时,它所指向的资源也会被自动释放。 在原本的C++中,new和delete必须配对使用,然而给每个异常处理分支添加delete是一件很麻烦的事。auto_ptr就是用来干这事的,它无需显式调用delet...

2020-04-13 10:20:35 40 0

原创 C/C++编程心得(二)

参考资料 https://en.cppreference.com/ 这个网站可以查到C++的标准库的用法。 https://isocpp.org 这个是C++标准组织的网站,可以查看C++的新特性。 http://isocpp.github.io/CppCoreGuidelines/CppCore...

2020-03-30 10:14:14 56 0

原创 深度学习(四十三)——深度强化学习(6)AlphaGo全系列

AlphaGo全系列 AlphaGo算是这波AI浪潮的里程碑事件了。如果说AlexNet让学术界重新认识了DL的话,AlphaGo则让大众都认识到了DL的威力。我也是在AlphaGo的感召之下,投身ML/DL领域的(2016.7)。因此,了解AlphaGo的原理,就成为了我一直以来的目标。岂料直到...

2020-03-16 11:12:40 221 0

原创 深度学习(四十二)——深度强化学习(5)PPO, IMPALA, Hierarchical RL, OpenAI

PPO(Proximal Policy Optimization) PPO是2017年由OpenAI提出的一种基于随机策略的DRL算法,也是当前OpenAI的默认算法。 PPO是一种Actor-Critic算法。它的主要改进在它的Actor部分。 我们知道,Policy Gradient算法的训练...

2020-03-09 10:16:01 255 0

原创 深度学习(四十一)——深度强化学习(4)A2C & A3C, DDPG

A2C & A3C Actor-Critic一般简称AC算法。针对它的一般用法参见《机器学习(三十五)》。 AC算法也可用于DRL领域,具体的做法和DQN类似: 一个Actor网络,用来近似V值。 一个Critic网络,用来近似Q值。 这里有个小技巧: Actor网络和Crit...

2020-03-02 10:29:40 642 0

原创 深度学习(四十)——深度强化学习(3)Deep Q-learning Network(2), DQN进化史

Deep Q-learning Network(续) Nature DQN DQN最早发表于NIPS 2013,该版本的DQN,也被称为NIPS DQN。NIPS DQN除了提出DQN的基本概念之外,还使用了《机器学习(三十三)》中提到的Experience Replay技术。 2015年初,De...

2020-02-24 11:12:25 225 0

原创 深度学习(三十九)——深度强化学习(2)概述, Deep Q-learning Network(1)

概述 上图是深度强化学习的脉络图,参考文献中还有该领域的关键论文列表。 原图地址: http://louiskirsch.com/maps/reinforcement-learning 参考: https://mp.weixin.qq.com/s/781fVvKr4yuq4q2GI1Y1gA...

2020-02-10 16:22:35 120 0

原创 机器学习(三十九)——博弈论(2), Exploration & Exploitation

博弈论 智猪博弈问题 智猪博弈问题是John Nash于1950年提出的问题。 在一个猪圈里养着一头大猪和一头小猪,在猪圈的一端放有一个猪食槽,在另一端安装有一个按钮,它控制着猪食的供应量。假定: 猪按一下按钮,就有8单位猪食进槽,但谁按按钮就会首先付出2单位成本; 若大猪先到食槽,则大猪吃到7...

2020-01-06 16:09:06 112 0

原创 机器学习(三十八)——博弈论(1)

博弈论 博弈论(game theory)是一门单独的学科,和RL并无统属关系。然而由于RL,特别是MARL大量应用到了相关的知识,所以这里也把它写在RL系列里了。 历史 博弈论最早可追溯到“齐威王田忌赛马”,但它真正的发展是在20世纪下半叶。 RL的历史相对比较晚,因此从渊源来看,RL=博弈论+控...

2019-12-23 10:31:26 154 0

原创 机器学习(三十七)——Integrating Learning and Planning(3)

Integrating Learning and Planning Monte-Carlo Search(续) 下面我们结合实例(下围棋)和示意图,来实际了解MCTS的运作过程。 第一次迭代:五角形表示的状态是个体第一次访问的状态,也是第一次被录入搜索树的状态。我们构建搜索树:将当前状态录入搜索...

2019-12-02 10:19:00 51 0

原创 机器学习(三十六)——Integrating Learning and Planning(2)

Integrating Learning and Planning(续) Table Lookup Model 查表模型适用于MDP的P,R都为已知的情况。我们通过visit得到各状态行为的转移概率和奖励,把这些数据存入表中,使用时直接检索。状态转移概率和奖励计算方法如下: P^s,s′a=...

2019-11-04 13:52:04 49 0

原创 机器学习(三十五)——Actor-Critic, Integrating Learning and Planning(1)

Actor-Critic 概述 MC策略梯度方法使用了收获作为状态价值的估计,它虽然是无偏的,但是噪声却比较大,也就是变异性(方差)较高。如果我们能够相对准确地估计状态价值,用它来指导策略更新,那么是不是会有更好的学习效果呢?这就是Actor-Critic策略梯度的主要思想。 Actor-Cri...

2019-10-28 10:05:37 76 0

原创 机器学习(三十四)——策略梯度

策略梯度 价值函数可以进行近似的参数化表达,策略本身也同样可以函数化、参数化: πθ(s,a)=P[a∣s,θ]\pi_\theta(s,a)=P[a | s, \theta]πθ​(s,a)=P[a∣s,θ] 所谓函数化是指,通过一个概率分布函数πθ(s,a)\pi_\theta(s,a)πθ​...

2019-10-21 09:36:43 90 0

原创 机器学习(三十三)——价值函数的近似表示

价值函数的近似表示 之前的内容都是讲解一些强化学习的基础理论,这些知识只能解决一些中小规模的问题。很多价值函数需要用一张大表来存储。当获取某一状态或行为的价值的时候,通常需要一个查表操作(Table Lookup),这对于那些状态空间或行为空间很大的问题几乎无法求解。 在实际应用中,对于状态和行为...

2019-10-14 08:58:12 131 0

原创 古希腊三大数学书(二)

古希腊三大数学书(续) 代数 代数学的历史要晚的多,无论东西方,基本都是公元1世纪产生萌芽,到了公元3世纪才有了初步的雏形。典型代表是中国的《九章算术》和希腊丢番图(Diophantus)的《算术》。 解析几何 解析几何虽然进入了现代中学课本,然而其出现的历史非常晚,一般以1637年笛卡尔发表的《...

2019-09-16 12:41:47 76 0

原创 古希腊三大数学书(一)

《几何原本》、《阿基米德全集》和《圆锥曲线论》被称为古希腊三大数学书,代表了文艺复兴之前欧洲数学的最高成就。 几何原本 《几何原本》是古希腊数学家欧几里得(Euclid)所著(约公元前300年),它是三大数学书中最早编写,影响也最大的书,在西方是仅次于《圣经》而流传最广的书籍。它是古典几何学的集大...

2019-09-09 10:32:39 511 0

原创 深度学习(三十八)——深度强化学习(1)教程

教程 http://incompleteideas.net/sutton/book/the-book-2nd.html 《Reinforcement Learning: An Introduction》,Richard S. Sutton和Andrew G. Barto著。 注:Richard ...

2019-09-02 16:08:49 252 0

原创 C/C++编程心得(二)

C/C++编程心得 strtok strtok函数多用于分割字符串,但它会改变被分割字符串的值。因此,如果该字符串以后还有用的话,需要首先复制该字符串,然后对复制的字符串执行strtok函数。 malloc与calloc 两者都是动态分配内存。 主要的不同:malloc不初始化分配的内存,已分配的...

2019-08-26 09:22:20 100 0

原创 深度学习(三十七)——CenterNet, Anchor-Free, NN Quantization

CenterNet CenterNet是中科院、牛津、Huawei Noah’s Ark Lab的一个联合团队的作品。(2019.4) 论文: 《CenterNet: Keypoint Triplets for Object Detection》 上图是CenterNet的网络结构图。 正如之前...

2019-07-29 09:35:36 649 1

原创 深度学习(三十六)——R-FCN, FPN, RetinaNet, CornerNet

R-FCN R-FCN是何恺明/孙剑小组的Jifeng Dai于2016年提出的。 论文: 《R-FCN: Object Detection via Region-based Fully Convolutional Networks》 代码: https://github.com/PureDior...

2019-07-15 09:47:41 167 0

原创 深度学习(三十五)——Style Transfer(2), YOLOv3, Tiny-YOLO, One-stage vs. Two-stage

Style Transfer Texture Networks: Feed-forward Synthesis of Textures and Stylized Images 这篇论文属于fast style transfer类的改进。它是Skolkovo Institute of Science...

2019-06-03 10:28:24 296 0

原创 数学狂想曲(十一)——高阶统计, 最速降线, 泛函 & 变分

高阶统计 Cumulants(续) 在介绍Cumulants之前,我们首先看一下Moment-generating function: MX(t):=E⁡[etX],t∈RM_X(t) := \operatorname E \left[e^{tX}\right], \quad t \in \mat...

2019-05-13 09:27:59 312 0

原创 AI Chip(一)

AI Chip https://basicmi.github.io/AI-Chip/ A list of ICs and IPs for AI, Machine Learning and Deep Learning. NN计算的硬件设计 NN计算问题的瓶颈主要包括两类: 1.数学运算的速度。NN...

2019-05-06 09:25:54 415 0

原创 深度学习(三十四)——深度推荐系统

深度推荐系统 推荐系统一直是AI能够落地且商业前景很好的一个研究方向。自2016年以来,该方向也逐渐被DL所侵蚀,尽管目前从招聘来说,这方面的职位仍以普通ML为主。 2017年5月,我曾面试了一家电商企业。当时给我的感觉,虽然里面的工程师较早接触ML,然而知识老化现象比较严重,对最基本的神经网络知...

2019-04-08 09:25:17 446 0

原创 AI工具

AI工具 https://mp.weixin.qq.com/s/TT4whft1Tj1pCEPbnMH1cA 清华大学发布OpenNE:用于网络嵌入的开源工具包 https://mp.weixin.qq.com/s/r01vfSKb4VpFXVyokb54Bg MIT开放图像标注工具LabelMe...

2019-04-01 09:52:28 510 0

原创 CPU, 数字成像

CPU https://zhuanlan.zhihu.com/p/29743431 CPU制造的那些事之一:i7和i5其实是孪生兄弟!? https://zhuanlan.zhihu.com/p/29767262 CPU制造的那些事之二:Die的大小和良品率 https://zhuanlan.zh...

2019-03-25 09:45:16 231 0

原创 深度学习(三十三)——GAN参考资源

GAN参考资源 https://blog.csdn.net/liuxiao214/article/category/6940697 某GAN专栏 https://mp.weixin.qq.com/s/oCDlhzjOYTIhsr5JuoRCJQ IRGAN:大一统信息检索模型的博弈竞争 https...

2019-03-18 09:14:36 253 0

原创 高考, 流浪地球, 医药

高考 上图是1977~2017年高考录取人数统计。从中可以看出以下事实: 1.1977年的高考是恢复高考的第一年,比改革开放要早1年,算的上是高等教育先期解冻了一步。由于通知是10月出来的,因此该年的考试实际上是12月10日开始的,也是唯一的一次冬季高考。此外,由于各省自主命题,考试时间也...

2019-03-11 10:01:23 326 0

原创 深度学习(三十二)——AlphaGo, AlphaStar

AlphaGo 樊麾讲解AlphaGo与李世石的五番棋: https://deepmind.com/research/alphago/alphago-games-simplified-chinese/ 论文: 《Mastering the game of Go with deep neur...

2019-02-25 10:21:42 1296 0

原创 深度学习(三十一)——Style Transfer

Style Transfer 上图是Style Transfer问题的效果图:将图片B的风格迁移到另一张图片A上。 上图是图像风格迁移所涉及的科技树。 在继续讨论之前,我们有必要指出Style Transfer和其他传统的有监督学习的CV问题之间的差异。 1.风格这种抽象的概念,该如何定义?艺...

2019-02-18 15:29:00 346 0

原创 Ubuntu使用技巧(二)

Ubuntu 16.04使用手记 Ubuntu 16.04正式发布(2016.4.21)之后,我第一时间下载了下来。 平心而论,虽然厂商已经很努力,但是Ubuntu的版本升级,仍然存在诸多不兼容的问题。我的电脑最初装的是12.04,后来利用apt升级为14.04。然而,从这次的升级体验来说,不仅升...

2019-01-14 13:45:00 231 0

原创 区块链参考资源, 雷达 & 信号处理

区块链参考资源 https://mp.weixin.qq.com/s/bkLBaTs3pSQyYg9YgRnG8w 盘点近期区块链媒体、论坛、公号资源 https://mp.weixin.qq.com/s/hn1a9XZSu_lL5TPgq5ln2A 区域链相关资料汇总 https://mp.we...

2019-01-07 10:08:12 10199 0

原创 多维数组的行优先和列优先, 数据描述语言

多维数组的行优先和列优先 这里以numpy为工具,介绍一下多维数组的行优先和列优先的概念。 首先我们生成一个3x4的数组: arr = np.arange(12).reshape(3,4) 它的形状是这样的: 如果我们按照C语言的方式存储它,也就是行优先存储的话,那么在内存中,它的形状是这样的:...

2018-12-24 10:33:50 3182 0

原创 知名数据集

知名数据集 MNIST MNIST是一个手写字符集,也是学习深度学习和SVM的入门必备数据集。目前由Yann LeCun维护。网址: http://yann.lecun.com/exdb/mnist/ MNIST是NIST的一个子集,包含了6万个训练样本和1万个测试样本。为了避免碎小文件的问题,所...

2018-12-17 09:25:42 1154 0

原创 TensorFlow(二)

TensorFlow 控制流 tf.cond a=tf.constant(2) b=tf.constant(3) x=tf.constant(4) y=tf.constant(5) z = tf.multiply(a, b) result = tf.cond(x < y, lambd...

2018-12-10 09:43:06 183 0

原创 深度学习(三十)——Deep Speech, 自动求导

CTC 推断计算(续) 上图是一个Beam Width为3的Beam Search。Beam Search的细节可参见《机器学习(二十三)》。 由于语音的特殊性,我们实际上用的是Beam Search的一个变种: 如上图所示,所有在合并规则下,能够合并为同一前缀的分支,在后续计算中,都被认为是...

2018-11-26 09:41:57 845 0

原创 word2vec, LSTM Speech Recognition实战, 图数据库

word2vec word2vec是Google于2013年开源推出的一个用于获取word vector的工具包。作者是Tomas Mikolov。 Github: https://github.com/tmikolov/word2vec 注:Tomas Mikolov,捷克布尔诺科技大学博士。...

2018-11-19 10:34:13 675 0

提示
确定要删除当前文章?
取消 删除