日常报错记录
记录一下日常学习工作中遇到的报错以及解决办法。
J心流
这个作者很懒,什么都没留下…
展开
-
安装tensorrt_llm踩坑总结
这些警告信息表明在编译或链接过程中找不到某些共享库 (libopen-rte.so.40, libopen-pal.so.40, libm.so.6, libhwloc.so.15)。这些库是 OpenMPI(用于并行计算的消息传递接口)的依赖库。其实系统中是有这些文件的,只不过没有在指定的路径下,所以只需要找到这些文件,然后重新指定一下这些文件的路径。除了文件找不到,各种库的版本适配也是个大问题,因为这个框架一直在迭代,还不是很稳定,建议安装tensorrt_llm。原创 2024-07-26 15:07:25 · 399 阅读 · 0 评论 -
Some tensors share memory, this will lead to duplicate memory on disk
报错的代码,在执行完这行代码后的到的 supported_classes 为 (PreTrainedModel,) ,这时保存checkpoint的逻辑又要经过多次判断才能保存,所以就出错了。报错发生在 trainer 保存 checkpoint 的时候,从源码来看,trainer 在保存 checkpoint 的时候会经过一系列的判断,然后选择合适的方法来保存。这种方法仅是为了解决问题而提出的,感觉走的是歪路,但是经过验证保存的 checkpoint 是正常可用的。此外,这种方法不一定能适用各种场景。原创 2024-07-20 12:48:54 · 419 阅读 · 0 评论 -
Couldn‘t apply path mapping to the remote file. /home/anaconda/envs/whisper/lib/python3.10/
点击Path mappings右边的文件夹,点击左上方的加号,然后手动输入本地路径和远程路径,点击完成,问题解决。今天试着远程调试代码,配置好路径之后还是遇到了如题的报错,然后一顿鼓捣,最后通过以下方法解决问题。1、点击Edit Configurations。原创 2023-12-05 11:05:52 · 796 阅读 · 0 评论