self-attention RNN CNN时间复杂度

momo+cc

已于 2022-05-24 21:36:19 修改

阅读量3.3k

点赞数 4

分类专栏：学习文章标签：算法

于 2022-05-23 20:50:07 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/mumujia_/article/details/124934648

版权

学习专栏收录该内容

2 篇文章 0 订阅

订阅专栏

下文推导的前提：

n：输入序列长度

d：embedding的大小

1.self-attention 时间复杂度

上图为 n×n的矩阵A和 n×n的矩阵B相乘的时间复杂度

同理

n×d的矩阵Q和 d×n的矩阵KT相乘的时间复杂度为 O(n^2 d)

n×n的矩阵softamx(Q*KT)和 n×d的矩阵V相乘的时间复杂度为 O(n^2 d)

而softmax(n×n)的时间复杂度为 O(n^2)

所以self-attention最终的时间复杂度为 O(n^2 d)（选最大的）

2.CNN 时间复杂度

有一定的前提条件：要求输入和输出的大小相同为 n×d

卷积核 kernel 大小为 k×d

则有——需要对输入 n×d 进行padding ，加(k-1)行

同时需要 d 个核

然后一个核的复杂度为 O(kd)，n行为 O(nkd)，d列为 O(nk d^2)

3.RNN 时间复杂度

其实这个我也不是很清楚，找了一个RNN的计算图

RNN计算公式为

self-attention中计算复杂度大致就是这样了，时间复杂度有时候看不出来的话，还是要写一写，自己感觉还是写成代码比较直观。

关注

4
点赞
踩
9

收藏

觉得还不错? 一键收藏
2
评论
self-attention RNN CNN时间复杂度

上图为 n×n的矩阵A和 n×n的矩阵B相乘的时间复杂度同理n×d的矩阵Q和 d×n的矩阵KT相乘的时间复杂度为 O(n^2 d)n×n的矩阵softamx(Q*KT)和 n×d的矩阵V相乘的时间复杂度为 O(n^2 d)而softmax(n×n)的时间复杂度为 O(n^2)所以self-attention最终的时间复杂度为 O(n^2 d)...
复制链接

扫一扫

专栏目录

momo+cc CSDN认证博客专家 CSDN认证企业博客

码龄4年

11: 原创

98万+: 周排名

31万+: 总排名

6841: 访问

: 等级

119: 积分

0: 粉丝

4: 获赞

3: 评论

12: 收藏

私信

关注

热门文章

分类专栏

学习 2篇
加油刷题 8篇

最新评论

codeblocks 提示ld.exe cannot find -lwinmm.lib等各种lib文件
CSDN-Ada助手: 恭喜您写了第11篇博客！看到您遇到了codeblocks提示无法找到-lwinmm.lib等各种lib文件的问题，我想说您真的很勤奋，不断地挑战自己并解决问题。在代码编译过程中遇到问题是正常的，您已经很好地记录并分享了解决方案。对于下一步的创作建议，我谦虚地建议您可以继续分享一些关于代码编译和调试的经验，比如如何正确配置开发环境，如何处理不同库文件的链接问题等等。这样的话，更多的读者可以从您的博客中获益，并且您也可以进一步提升自己的技术水平。期待您继续创作，祝您一切顺利！
self-attention RNN CNN时间复杂度
CSDN-Ada助手: 非常感谢您的分享，这篇博客对于理解self-attention RNN CNN的时间复杂度有很大帮助。我觉得你可以写一篇关于如何优化self-attention模型的博客，包括但不限于如何减少时间复杂度、如何提高模型的准确率和鲁棒性等方面。这样的技术文章对其他用户也会非常有帮助。下一篇你可以继续就self-attention模型的优化方向继续写，相信会有更多读者受益。期待你的下一篇好文！为了方便博主创作，提高生产力，CSDN上线了AI写作助手功能，就在创作编辑器右侧哦～（https://mp.csdn.net/edit?utm_source=blog_comment_recall ）诚邀您来加入测评，到此（https://activity.csdn.net/creatActivity?id=10450&utm_source=blog_comment_recall）发布测评文章即可获得「话题勋章」，同时还有机会拿定制奖牌。
self-attention RNN CNN时间复杂度
momo+cc: 时间复杂度就是看主要语句的运行次数，弄清思路写一写就比较清楚了
self-attention RNN CNN时间复杂度
滴西歪 �: 不是说深度学习模型的时间复杂度很复杂吗，咋这一下就算出来了

大家在看

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。