文献
文章平均质量分 86
木子不多余
这个作者很懒,什么都没留下…
展开
-
阅读论文3
在看这篇论文之前,可以先学一些基本概念,一些大佬梳理好的知识例如:https://blog.csdn.net/csdn_xmj/article/details/138724399 在一篇 “基于Pytorch框架,从零实现Transformer模型实战”提示:以下是本篇文章正文内容主要的序列转导模型基于包括编码器和解码器的复杂递归或卷积神经网络。性能最好的模型还通过一种注意机制连接编码器和解码器。我们提出了一个新的简单的网络结构,变压器,完全基于注意力机制,完全免除递归和卷积。原创 2024-09-11 14:12:10 · 977 阅读 · 0 评论 -
阅读论文2
为了实现更大的加速,研究人员采用GPU来实现并行算法,因为与CPU相比,GPU通常拥有更多内核,能够更好地完成并行计算。遥感图像是通过遥感技术获取的图像,这种技术使用飞机、卫星或其他飞行器上的传感器来从空中收集地球表面的数据。Tan等人[63]提出了一种用于遥感图像分类的并行特征提取方法,称为高斯-伯努利约束玻尔兹曼机。Bernabé等人[62]在多核CPU上开发了用于遥感高光谱图像的并行解混链方法。Jiménez等人[67]介绍了一种用于高光谱图像解混的并行空间-光谱预处理算法。原创 2024-09-05 16:20:28 · 260 阅读 · 0 评论 -
阅读论文1_d
在本文中,我们引入了 DistriFusion 来加速具有多个 GPU 的扩散模型以实现并行性。我们的方法将图像分成多个块,并将每个块分配给单独的 GPU。我们重用了之前步骤中预先计算的激活来维护块交互。在 Stable Diffusion XL 上,我们的方法在 8 个 NVIDIA A100 上实现了高达 6.1 倍的加速。这一进步不仅提高了 AI 生成内容创建的效率,还为未来 AI 应用并行计算的研究树立了新的标杆。原创 2024-09-03 14:28:47 · 741 阅读 · 0 评论 -
阅读论文1_c
至此,这篇论文的方法部分算是看完了,还有很多地方没理解,浅浅的按照自己的理解总结一下他干了什么.在整篇论文中引入了位移块并行技术,实现扩散模型能够让一张图片进行gpu并行,从而解决高质量图片的延迟问题修改了原始运算符 Fl,Fl 是卷积、线性或交叉注意层,以选择性地在新鲜区域上启用稀疏计算修改了扩散模型的GN层,使其不要那么慢的进行组归一化计算,如利用公式快速计算均值和方差,从而节省计算成本,产生的通信成本也可以被隐藏。原创 2024-09-02 21:25:08 · 608 阅读 · 0 评论 -
阅读论文1_b
写的整体格式是 对论文相对位置的翻译,斜体是自己的理解部分。原创 2024-08-28 13:07:08 · 800 阅读 · 0 评论 -
论文阅读1_a
文献阅读。原创 2024-08-22 12:38:56 · 100 阅读 · 0 评论