实验踩坑 flash_attn_2_cuda undifiend symol

最新推荐文章于 2024-07-29 16:20:33 发布

崩溃李

最新推荐文章于 2024-07-29 16:20:33 发布

阅读量613

点赞数 10

文章标签： linux

本文链接：https://blog.csdn.net/qq_45647688/article/details/139993663

版权

报错

RuntimeError: Failed to import transformers.models.llama.modeling_llama because of the following error (look up to see its traceback):
…/lib/python3.10/site-packages/flash_attn_2_cuda.cpython-310-x86_64-linux-gnu.so: undefined symbol: _ZN2at4_ops5zeros4callEN3c108ArrayRefINS2_6SymIntEEENS2_8optionalINS2_10ScalarTypeEEENS6_INS2_6LayoutEEENS6_INS2_6DeviceEEENS6_IbEE

解决方案

在 flash-attention-release 找到对应版本的轮子，注意，必须对应torch + cuda + python版本。

像我一样网络不好的可以先下载到本地，再上传服务器，只有100M。

然后安装

pip install flash_attn-2.5.8+cu122torch2.3cxx11abiFALSE-cp310-cp310-linux_x86_64.whl

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

崩溃李

关注关注

10
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
实验踩坑 flash_attn_2_cuda undifiend symol

找到对应版本的轮子，注意，必须对应torch + cuda + python版本。像我一样网络不好的可以先下载到本地，再上传服务器，只有100M。
复制链接

扫一扫