伯禹ElitesAI·动手学深度学习PyTorch版——task02

一、分词工具

  1. spacy
  2. nltk

二、时序数据的采样

1.随机采样

随机采样是根据时间步长划分出若干子序列即样本,每个子序列长度为时间步长,batch_size决定了抽取几个样本,也就是抽取batch_size个子序列,最终得出的采样结果是batch_size*num_steps的矩阵。注意X出现次数不是batch_size,并且每个样本最多出现一次

2.相邻采样

相邻采样是根据batch_size等分序列得到batch_size个子序列,然后将子序列堆叠到一块,各子序列按照时间步长取整划分若干子子序列,由于子子序列是堆叠到一起的,类似于一个桶,也就是得到了若干个桶,每个桶就是一个样本结果,即batch_size*num_steps的矩阵

三、rnn流程

1.定义损失函数

2.定义优化函数

3.定义迭代次数,对接下来命令进行迭代循环

4.定义采样方法

5.在抽出样本后分离隐藏状态,减少计算开销

6.定义rnn模型,并带入样本进行计算输出

7.计算损失函数值

8.梯度清零,方向传播进行计算参数

9.梯度剪裁

10.优化函数进行优化,更新参数

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值