暑期项目实训7.19 论文复现+寻找并阅读新论文

最新推荐文章于 2023-04-11 00:19:21 发布

JimMoriarty

最新推荐文章于 2023-04-11 00:19:21 发布

阅读量274

点赞数

分类专栏：暑期项目实训文章标签：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/JimMoriarty/article/details/118915645

版权

时间序列预测卷积网络 CA-SFCN 注意力机制模型复现

关键词由CSDN通过智能技术生成

暑期项目实训专栏收录该内容

15 篇文章 1 订阅

订阅专栏

最近的工作就是复现完成之前提到的论文，并且阅读看到的新的论文。

上篇论文剩下的就是CAAN模块，我从网上找到了讲的很清楚的一张图：

扒源码：跳出self-attention看多头点积注意力 - 知乎 (zhihu.com)

经过多方面的了解后，这部分网络结构其实不难完成，随着这个模型的完成，剩下的就是超参数设置和训练，其中有个超参数我连调的大概范围都不知道，于是主动联系了作者，作者给予了我一些指导：

非常感谢作者的知道，让我少走了很多弯路

在复现完成的论文中，我认识到了一个作为baseline的CA-SFCN模型，表现还挺好的，而且是基于卷积网络的，我也想把它复现了看一看效果。

CA-SFCN是2020年发表在顶会的一篇文章，网络上几乎没有资料讲解，唯一可依靠的就是它的论文。

下面简单介绍一下它的模型：

这是2020年发表的一篇基于卷积和新的注意力计算方式（对我而言）的时间序列预测论文，股票预测并不在它的论文的data里面，是用来预测其他时间序列的，但因为他是基于cnn的，而且在上篇论文中作为baseline出现，表现挺好，我复现一下。

这篇论文github只有一篇官方代码，但官方的代码是基于论文的，不仅涉及近10中baseline，还有近10种数据的处理，而且没有股票data，我感觉得有几万到十几万行代码，完全不是我能看的东西。

简单来说就是通过多层SFCN（s是它论文中提到的stable)，提取特征，得到一个X，再送入Temporal Attention模块中学习时间注意力。

再送入Variable Attention学习空间（股票之间的）注意力。（和TA是相似的）。这儿学习注意力的方式和之前RNN模型中不同，还是通过多个1*1的卷积和矩阵乘法进行，和CAAN中的差不多，最后送入Globaling Pooling中，每个特征图每只股票保留一个数据，然后再进行一次全连接网络和Softmax输出涨或跌。是一个分类预测。

Cross Attention在上篇论文中的CAAN中有过了解，采用的相似的算法。

我的最好有62%的正确率

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
暑期项目实训7.19 论文复现+寻找并阅读新论文

to be done
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。