hw4_RNN 作业问题记录

问题1:为什么labels必须转成float?
在这里插入图片描述

问题2:embedding.weight是做什么用的?从观察来看,embedding.weight中存储的是和词嵌入矩阵一模一样的值,既他也是一个词嵌入矩阵,他的作用是什么?
在这里插入图片描述
猜测:他是真正被训练的参数。因为我们知道词嵌入矩阵中的词向量数值即是词嵌入模型中的隐含层的参数,再加上下一行我们看到有self.embedding.weight.requires_grad = False if fix_embedding else True
这样一句话,代表weight是可以计算梯度的,所以猜测torch中的embedding模型真正在训练的时候是对这个weight计算梯度下降的。虽然他的值和词嵌入矩阵一模一样,但torch在真正梯度运算的时候是用weight来算的。

问题3:这是一个程序实际运行时的bug,在将dataloader的num_workers参数设置为非默认的时候,每次运行到training()的enumerate dataloader的时候都会突然增加一大堆mainthread,导致内存溢出。不设置dataloader的num_workers之后程序恢复正常。暂时还没搞懂dataloader的这个num_workers有什么坑。
在这里插入图片描述
在这里插入图片描述

问题4:为什么每个epoch最后一个batch的准确率都低的离谱?5个epoch里每个epoch都是最后一个batch准确度只有30左右,前面1000多个batch准确率都在百分之70左右。
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
tf.nn.dynamic_rnn是TensorFlow中的一个函数,用于创建一个动态RNN(循环神经网络)模型。它接受一个RNN单元(如BasicRNNCell或BasicLSTMCell)作为参数,并根据输入数据的形状和长度自动构建RNN模型。 在引用\[1\]中的示例中,tf.nn.dynamic_rnn被用于创建一个多层的RNN模型。通过传入一个多层的RNN单元(MultiRNNCell)和输入数据(X),函数会返回输出(outputs)和状态(states)。 在引用\[2\]和引用\[3\]中的示例中,tf.nn.dynamic_rnn被用于创建单层的RNN模型。通过传入一个RNN单元(BasicRNNCell或BasicLSTMCell)和输入数据(X),函数同样会返回输出(outputs)和状态(states)。 需要注意的是,输入数据X的形状应为\[batch_size, n_steps, input_dim\],其中batch_size表示批量大小,n_steps表示时间步数,input_dim表示输入维度。而seq_length参数用于指定每个样本的序列长度,以便在处理数据时考虑真实的序列长度。 总结起来,tf.nn.dynamic_rnn函数用于创建动态RNN模型,根据输入数据的形状和长度自动构建模型,并返回输出和状态。 #### 引用[.reference_title] - *1* [tf.nn.dynamic_rnn详解](https://blog.csdn.net/wang263334857/article/details/99690195)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^koosearch_v1,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* *3* [tf.nn.dynamic_rnn](https://blog.csdn.net/Hello_word5/article/details/103462954)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^koosearch_v1,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值