![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
学习
阅读论文中遇到的一些可以解决的问题
momo+cc
这个作者很懒,什么都没留下…
展开
-
self-attention RNN CNN时间复杂度
上图为 n×n的矩阵A和 n×n的矩阵B相乘的时间复杂度同理n×d的矩阵Q和 d×n的矩阵KT相乘的时间复杂度 为 O(n^2 d)n×n的矩阵softamx(Q*KT)和 n×d的矩阵V相乘的时间复杂度 为 O(n^2 d)而softmax(n×n)的时间复杂度为 O(n^2)所以self-attention最终的时间复杂度为 O(n^2 d)...原创 2022-05-23 20:50:07 · 3352 阅读 · 2 评论 -
tensorboard 显示graph 不显示scalar
修改代码崩溃一上午,找了一些文章加上与源代码相比发现是summaries的语句顺序问题首先应该是tf.summary.scalar()这句是给需要画出来的函数一个名字,相当于初始化tf.summary.merge_all()这表示将所有summary全部保存到磁盘,以便tensorboard显示之后经过with tf.Session() as sess:开始准备训练然后就是加入保存位置然后准备写入os.path.join()tf.summary.FileWriter(原创 2022-04-30 14:13:52 · 371 阅读 · 0 评论