![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
模型学习记录
文章平均质量分 91
模型学习
jonny的学习日记
好好学习 为了更好的生活而努力!!
一起学习啊!
展开
-
学习记录--Transformer(学习记录,大部分copy)
其他的在具体地方都有标注参考了哪位大佬的博客。原创 2024-06-14 11:28:15 · 962 阅读 · 0 评论 -
学习记录--GPT
GPT原创 2024-07-19 10:41:24 · 843 阅读 · 0 评论 -
LSTM笔记
另一个值得注意的是LSTM的输出有3个变量,即output,(h_n,c_n),其中output是LSTM最后一层每个时间步的输出,h_n和_c_n为最后一个时间步每层的隐状态和记忆,其中经过batch_first以后,我们的输出是[batch_size,seq_len,hidden_size。output大小,h_n大小,c_n大小: torch.Size([128, 27, 512]) torch.Size([4, 128, 512]) torch.Size([4, 128, 512]原创 2023-03-22 09:33:55 · 285 阅读 · 0 评论 -
attention
output大小,h_n大小: torch.Size([128, 31, 1024]) torch.Size([1, 128, 512])2:源数据shape,目标数据shape torch.Size([31, 128]) torch.Size([35, 128])4:目标数据 tensor([[ 2, 2, 2, ..., 2, 2, 2],3:源数据 tensor([[ 2, 2, 2, ..., 2, 2, 2],原创 2023-03-19 16:18:48 · 339 阅读 · 0 评论