Flash-attention部署

最新推荐文章于 2024-07-12 20:42:58 发布

SkyTai

最新推荐文章于 2024-07-12 20:42:58 发布

阅读量366

点赞数 10

文章标签： pytorch python 深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/SkyTai/article/details/138764333

版权

Flash-attention官方链接

https://github.com/Dao-AILab/flash-attention/tree/main
请按需查看详细设备支持情况，以及版本迭代日志

确定CUDA版本

nvidia-smi

根据CUDA、Python、PyTorch、OS版本下载whl

链接：https://github.com/Dao-AILab/flash-attention/releases

PS.

***ABI（Application Binary Interface）***标记定义了二进制代码的接口规范，特别是对于C/C++扩展模块。如果abi标记为True，意味着该whl包是使用了ABI稳定版本的Python C API进行编译的，而如果abi标记为False，意味着该包不是使用ABI稳定版本的Python C API进行编译的。

确认&安装ninja

安装ninja

pip install ninja

验证ninja

ninja --version
echo $?

如果返回结果为0，则代表ninja运作正常
若异常，则卸载，重新安装

pip uninstall -y ninja
pip install ninja

部署

pip install flash_attn-2.5.8+cu122torch2.2cxx11abiFALSE-cp310-cp310-linux_x86_64.whl

关注

10
点赞
踩
4

收藏

觉得还不错? 一键收藏
2
评论
Flash-attention部署

**ABI（Application Binary Interface）***标记定义了二进制代码的接口规范，特别是对于C/C++扩展模块。如果abi标记为True，意味着该whl包是使用了ABI稳定版本的Python C API进行编译的，而如果abi标记为False，意味着该包不是使用ABI稳定版本的Python C API进行编译的。链接：https://github.com/Dao-AILab/flash-attention/releases。如果返回结果为0，则代表ninja运作正常。
复制链接

扫一扫

SkyTai

CSDN认证博客专家 CSDN认证企业博客

码龄5年

华东理工大学

7: 原创

129万+: 周排名

12万+: 总排名

4605: 访问

: 等级

107: 积分

114: 粉丝

35: 获赞

10: 评论

24: 收藏

私信

关注

热门文章

最新评论

Flash-attention部署
普通网友: 写的真好，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
Flash-attention部署
CSDN-Ada助手: 恭喜用户发布了第7篇博客，标题为“Flash-attention部署”！持续创作不易，你的努力和热情让我们看到了你的进步。希望你可以继续保持这样的创作热情，不断学习和探索新的领域，也可以考虑分享一些实践经验或者案例分析，让读者更加深入地了解你的专业知识。期待你的下一篇作品！愿你越来越优秀！
【Hugging Face】Transformer.TrainingArguments Parameters/参数
骑猪的胖子ovo: 请问一下如果想改默认的多gpu运行，该怎么操作呢？
Github Connection was aborted && Couldn‘t connect to server
CSDN-Ada助手: 恭喜你写了第5篇博客！看到你克服了Github连接中断的问题，真是令人佩服。不过，我觉得你可以尝试写一些关于解决类似问题的技巧和经验分享，对其他遇到类似困扰的人可能会有所帮助。希望你能继续保持创作的热情，期待你的下一篇博客！
Milvus in Windows 部署与使用
CSDN-Ada助手: 恭喜您写成了第6篇博客！《Milvus in Windows 部署与使用》这个标题听起来非常有趣，我很期待阅读您的文章。您在Windows上部署和使用Milvus的经验一定会给读者带来很大的帮助。在下一步的创作中，或许您可以考虑分享一些高级的Milvus特性或者与其他相关技术的整合。谢谢您持续创作，希望您能继续分享有关Milvus的精彩内容！

大家在看

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。