- 博客(4)
- 资源 (4)
- 收藏
- 关注
原创 概率图之马尔可夫随机场(Markov Random Field,MRF)
现实生活中,许多任务涉及多个因素(变量),并且因素之间存在依赖关系。概率图模型(Probabilistic Graphical Model,PGM)为表示、学习这种依赖关系提供了一个强大的框架,概率图模型在形式上由图结构组成,一个节点(node)表示一个或一组随机变量,节点之间的边(edge)表示变量之间的关系。根据图是有向还是无向,概率图模型可以分为两类:第一类使用有向无环图表示变量之间的因果关...
2018-09-27 22:58:13 37044 9
原创 Attention机制
在sequence-to-sequence学习中,输入和输出都是序列,通常采用Encoder-Decoder的框架进行处理。这种结构首先通过编码器(如CNN/RNN/LSTM等)将输入序列编码成一个固定长度的中间向量,然后将该向量作为解码器(如DNN/CNN/RNN/LSTM)的输入进行解码得到最终结果。以机器翻译为例,其Encoder-Decoder结构如下:上图中,Encoder和De...
2018-09-24 22:30:51 2264 4
原创 使神经网络具有记忆力——RNN及LSTM
我们在进行判断决策时,除了会依靠当前的情况,也会调动大脑中的记忆,协同分析。记忆分为长期记忆和短期记忆,短期记忆可以认为是对之前较短时间内发生事件的印象,这对于一些日常生活应用非常的有必要。比如以下两个句子中,“我将在9月10日到达南京”和“我将在9月10日离开南京”,两句话虽然都包含“南京”,但是第一句话中“南京”是目的地,第二句话中“南京”是出发地,做出这个判断的依据是“南京”之前的“到达”和...
2018-09-18 19:25:36 7146 1
原创 计算图(Computational Graph)的角度理解反向传播算法(Backpropagation)
最近在回看反向传播算法(Backpropagation,BP算法)时,注意到目前各大深度学习框架如Tensorflow,Theano,CNTK等都以计算图(Computational Graph)作为描述反向传播算法的基础。计算图计算图是用来描述计算的语言,是一种将计算形式化的方法。在计算图中,计算被表示成有向图,图中的每一个节点表示一个变量(variable),变量可以是标量(sca...
2018-09-02 21:15:59 7191 4
不依靠第三方库实现一个神经网络
2019-05-07
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人