自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 Mamba: LLVM ERROR: Cannot select: intrinsic %llvm.nvvm.shfl.sync.bfly.i32

site-package/mamba_ssm/ops/triton/selective_state_update.py中的。注意:替换后仅仅是能够保证程序运行,并不能保证结果正确,事实上在我更换后测试的结果是错误的。修改后程序由gpt直接生成。第一个需要更改的地方在site-package/mamba_ssm/ops/triton/layernorm.py中的。解决方法一是按照上述链接中计算能力购买显卡,方法二是将使用了triton的方法利用原生pytorch代码替换。若还有其他请问,请参照。

2024-05-22 16:14:20 605

原创 pytorch运行过程中tensor数据变成<torch.Tensor object at 0x7f687a1dc440>

定位到问题是模型运行过程中所有的张量数据变成了如下形式。debug找到问题出在nn.Embedding层。torch版本1.8.0。

2023-12-06 11:00:25 1344 5

原创 ubuntu20.04系统遭遇死机,mce报内存错误,问题定位及解决

系统为ubuntu20.04.6,超微x9dri-f双路主板,两颗e5 2600v2系列cpu,内存条插满。主要用来跑深度学习模型,在训练过程中经常会出现死机的现象,开启mcelog后有如下报错MCE 0MCE 0有那么几个令人在意的点,似乎是内存的问题,多方查找无法找到定位cpu12 bank9位置的方法,最后在chatgpt的帮助下找到如下指令在我电脑上运行后得*-memory*-bank:0。

2023-06-19 08:57:36 114272

原创 pytorch-lightning多卡训练中途卡死,GPU利用率100%

使用torch1.7.1+cuda101和pytorch-lightning==1.2进行多卡训练,模式为'ddp',中途会出现训练无法进行的问题。发现是版本问题,升级为pytorch-lightning==1.5.10问题解除。在pip安装过程中会卸载掉我的torch,指定版本也没用,解决方式是等安装pytorch-lightning结束后再把torch版本换回来。

2023-04-12 09:39:41 2461 5

原创 在腾讯云服务器Ubuntu18系统中安装python3.8

9、pip安装提示The scripts f2py, f2py3 and f2py3.8 are installed in ‘/home/cyd/.local/bin‘ which is not on PATH。7、安装完成,由于系统自带python3.6和python2.7,python命令默认指向python2.7。1、在腾讯云中选择安装ubuntu18系统,安装成功后更改用户密码,开放防火墙权限。5、返回Python-3.6.8,指定安装路径。4、进入解压后的文件夹下的Modules。

2023-03-30 16:17:43 600

原创 ros python 自定义msg找不到模块问题

如果已经将自定义的msg文件生成的python头文件路径包含进settings.json中仍然没有解决问题可以试试source ./devel/setup.bash刷新环境变量再执行

2021-11-21 11:28:05 1819 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除