My solution to cs224n assignment2

My solution

1.tensorflow

  这个题目是一个编程题目,模板填空。
  这个题目相当于给出了tensorflow实现的模板或者框架。有必要掌握这个常用的框架,相比以前写的tensorflow代码大多是零散的,需要了解学习这种写法(不过具体写起来还是要因地制宜,我觉得零散的写法简单地封装有时候写起来也不错),就像需要学习pytorch的框架的写法一样,直接把模型写在forward函数里面。
  具体代码略,以前的tensorflow代码也写过很多了,就是没有掌握框架的写法。

2.transition-based dependency parser

模拟解析过程

这里写图片描述

  模拟解析,比较容易:

stackbuffernew dependencytransition
[ROOT][I, parsed, this, sentence, correctly]NoneInit
[ROOT, I][parsed, this, sentence, correctly]NoneSHIFT
[ROOT, I, parsed][this, sentence, correctly]NoneSHIFT
[ROOT, parsed][this, sentence, correctly](parserd, I)LEFT-ARC
[ROOT, parsed, this][sentence, correctly]NoneSHIFT
[ROOT, parsed, this, sentence][correctly]NoneSHIFT
[ROOT, parsed, sentence][correctly](sentence, this)LEFT-ARC
[ROOT, parsed][correctly](parsed, sentence)RIGHT-ARC
[ROOT, parsed, corectly][]NoneSHIFT
[ROOT, parsed][](parsed, correctly)RIGHT-ARC
[ROOT][](ROOT, parsed)RIGHT-ARC

NN解析算法的细节

  除了按照模板填空补全算法,还有一些对NN的考察,以下为涉及到的知识点的简要简析:

1.初始化

Given a matrix A of dimension m×n,Xavier initialization selects values Aij uniformly from [ϵ,ϵ],where ϵ=6m+n

2.dropout

这里写图片描述
   E(hdrop)=γEdEh=γ(1pdrop)h=h
   γ=11pdrop

3.Adam

这里写图片描述 
  梯度变化比较缓慢,不容易在最优解附近波动。另一方面,可以认为相当于渐进地一边调整一边计算了一个更大的minibatch,所以梯度会更准确。
  
这里写图片描述

  这样调整后,还加入了v这个项,在一段时间梯度很大的时候用于减缓学习率防止滑出过远,一段时间梯度很小的时候增加学习率,使得梯度比较小的时候能不陷入局部极值。

4.L2 reg

  正常的正则化

参数的保存和调优

  框架还保存了dev集合上的最优记录对应的参数,用于测试

3.RNN LM

RNN

RNN定义
  
这里写图片描述

GRU, LSTM是属于gated的RNN,与RNN大体一致,只是加了门。
LSTM已经很熟悉了,下面是GRU的模型:

这里写图片描述

类似RNN的一些模型类称为QRNNs(类RNNs),QRNN内部可能加入卷积来捕获n-gram同时帮助并行加速。

困惑度的定义

  困惑度的定义是语言模型中转移概率的概率倒数的几何平均。
  所谓转移概率是指给出前面的语境,然后语言模型给出的正确单词的概率。那么我们根据转移概率与交叉熵的关系可知,交叉熵是困惑度的对数。
  

求导

  和普通的BP没有本质区别,链式法则+维度调整,已经很熟了,所以我没去做。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值