![](https://img-blog.csdnimg.cn/20201014180756919.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
论文
文章平均质量分 97
记录自己看论文过程中的一些想法和思考以及每篇论文可能能用上的点
^Mark_Zhang^
禾益桑梓,造福百川。
展开
-
【论文复现】LSTM长短记忆网络
LSTM作为经典模型,可以用来做语言模型,实现类似于语言模型的功能,同时还经常用于做时间序列。由于LSTM的原版论文相关版权问题,这里以colah大佬的博客为基础进行讲解。之前写过一篇Tensorflow中的LSTM详解,但是原理部分跟代码部分的联系并不紧密,实践性较强但是如果想要进行更加深入的调试就会出现原理性上面的问题,因此特此作文解决这个问题,想要用LSTM这个有趣的模型做出更加好的机器学习效果😊。# 定义单个LSTM单元# 定义单个LSTM单元。原创 2024-05-26 23:00:11 · 1282 阅读 · 1 评论 -
【论文复现】Graph Attention Networks图注意力神经网络
这篇论文提出的核心方法就是在计算一个节点的输出的时候考虑与其相邻的节点对当前节点的影响,同时也将节点对自己的影响考虑在内,为了方便后续解释中将简化成GAT来表述,阅读原版论文有困难可以看一下Aleksa大神录制的讲解视频辅助理解,我在看完视频以后对第多头注意力下的结果输出部分茅塞顿开,同时对自己看论文的时候的一些理解也更加深刻了;另外还有B站上的GAT代码讲解视频的讲解很详细,相比于pytorch给出的源码。原创 2024-05-05 00:35:48 · 1119 阅读 · 2 评论