自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

qq_43527718的博客

rebekk CSDN认证博客专家 CSDN认证企业博客

码龄6年

157: 原创

6万+: 周排名

1万+: 总排名

18万+: 访问

: 等级

2318: 积分

557: 粉丝

618: 获赞

40: 评论

1200: 收藏

私信

关注

热门文章

分类专栏

最新评论

如何理解“对矩阵进行初等行变换不改变其列向量的线性关系”？
Djkistra: 全是干货，32个赞
原码、补码的乘除法总结
做而论道_CS: ACC，是英文缩写。其原意是：累加器。累加器这个单词的意义就是：　运算前，你存入原始数据。　运算后，这里有运算结果。在运算过程中，ACC 的内容是不变的。你可别随意改变 ACC 的功能啊！
原码、补码的乘除法总结
做而论道_CS: 乘法器、除法器，都是单独一个完整的电路。它们和 ACC，并没有非常密切的联系。做乘法、做除法，都是需要一些内部运算的。运算完毕后，才会把运算结果，送到 ACC。运算过程中的中间结果，是不会送到 ACC 的。由此来看，你写的这些，多数，都是错误的。你自己错了，还不要紧。千万不要拿你的错误，误导别人！
CPU访问一个虚拟地址的整体流程（CPU访问存储系统的整体流程）
成疏: 最后把页表和快表更新后本次就一定命中，不会再访问主存了吧

最新文章

llm

关注

文章平均质量分 95

关注数：文章数：1 文章阅读量：641 文章收藏量：6

作者: rebekk

这个作者很懒，什么都没留下…

展开

FlashAttention原理：从原始Attention到FlashAttention

以前的attention加速方法旨在减少attention的计算和内存需要，如sparse-attention、low-rank approximation等，但由于它们主要关注FLOP reduction，且倾向于忽略内存访问的开销，所以都没有达到wall-clock speedup。FlashAttention比普通attention的HBM（GPU high bandwidth memory）访问量更少，并适用于一系列SRAM大小。

原创 2024-09-26 14:44:52 · 654 阅读 · 0 评论