CS224n Assignment4解读 · 上

NMT中的一个问题
  1. problem: 输入的句子长短不一,如果要将所有的长短的输入都提炼为同样长度的向量,是比较难的。
  2. solution: 实际工程中较多的会通过堆叠RNN来解决不定长的input sentences的问题
  3. CS224n Assignment4: 通过找出最长的句子,再将其他所有的句子都扩充至这一长度来达到input sentences等长的效果。
python文档
  1. Library Reference标准库参考:标准库中的API在这里有定义和注释
  2. Language Reference语法参考: 这里给出了python的语法,上下文无关文法
    *在python文档中表示0 ~ n个重复
    []表示可选择的 0 ~ 1
python max()函数
  1. max为Python的内置函数,可以找出iterable中最大的元素,也可以找出传入的多个参数中的最大值。
  2. 其参数可以为iterable可迭代对象,iterable包括所有的序列类型,以及某些非序列类型。
max([len(sent) for sent in sents])形成list
sent + ['ant'] * 5list的扩充,类似有append函数
python函数定义
  1. 形参后的:为形参的注释
  2. 函数后的-> 为函数返回值的注释
yield
  1. 遍历函数如果遍历过程中每一步输出,这样的复用性不高
  2. 如果返回一个list或者序列,可复用,这样会占用大量的内存
  3. yield结合了这两者,既可以复用又不占用内存,使用它的函数无return,其使得函数变成了一个generator,相当于每次遍历跑一遍当轮次的代码
  4. 可以通过next()函数来体验generator的过程
CS224n - Assignment4
  1. utils.py提供了pad_sents, read_corpus, batch_iter
    pad_sents: 扩充较短的input sentences使得所有的句子长短一致
    read_corpus: 从语言文本中读入list[list[str]]
    batch_iter: 提供了数据集的batch generator,每个batch包括source sentences和相应的target sentences
  2. vocab.py为单词表生成器
    VocabEntry类为输入语言或者输出语言的词汇入口,提供了word2int & int2word接口
    Vocab类封装source & targe language
遗留问题
  1. 继续完成Assignment4
  2. 熟悉python语法
  3. 熟悉图神经网络代码
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值