项目复现踩坑记录
文章平均质量分 84
记录所有跑项目时遇到的问题
Debug的魔法小马
车带机器人研究生brony,专注项目复现排雷,欢迎技术交流~
可有偿配置深度学习/机器人环境、复现深度学习/机器人论文。
展开
-
Active Neural SLAM 复现记录
这里讲到,完整的Gibson数据集有572个空间,1440个楼层的场景,非常大。这又是一个版本问题,现在我的python3.10已经没有inspect.getargspec了,取而代之的是inspect.signature,而且返回的parameters还是一个有序字典,不再是列表。搜了下,这个字体付费,虽然可以免费下载,但感觉麻烦,换成无衬线字体族的Arial、Helvetica、Verdana、DejaVu Sans中一个。本项目论文中说,只用了Gibson的最小集合,所以那个11G的不下也没问题。原创 2024-09-11 14:40:10 · 809 阅读 · 0 评论 -
RedNet 复现记录
原来以为是数据读的数据有错误。我估计是torch.masked_select(loss_all, mask)) / torch.sum(mask.float())中,要么分子为inf,要么分母为0了。按照readme指示,下载SUNRGBD.zip和SUNRGBDtoolbox.zip,解压放到我的数据盘里,然后软链接过去就OK。搜索后知道是需要的数据类型是uint8位,而目前是f4也就是4字节浮点数,float32。于是改变参数,发现我的batch size调到3,不再out of memory。原创 2024-09-08 13:47:19 · 651 阅读 · 0 评论 -
SCTNet 项目排坑
奇怪了,之前还没问题的。查看了下github上的issue和官方文档,检查了好久,我的__init.py__没有问题。最后我想,是不是我把环境变量设成项目根目录就能找到这个模块了。看来作者的预训练权重放在pretrain文件夹内,我的在pretrained文件夹内。发现是指令里/写反了,这是因为作者应该是在win上运行,win和ubuntu在这个正好是反向的。由于这个项目也是基于mmsegmentation的,所以我想先看看之前那个环境是否能直接适配。不行,我再新建环境。因为他给的脚本是分布式训练的。原创 2024-04-01 14:49:23 · 1832 阅读 · 22 评论 -
MobileSAM 项目排坑
把MobileSAM这个项目跑通,明天就可以集中学习SAM、MobileSAM、EfficientSAM和Segformer的论文和代码了。那只能先这样了,看看今晚能不能做到只用核显负责桌面,多让出点独显显存。因为readme没说哪个是测试脚本,只给了基础用法。我觉得是网络代理的问题。那好说,因为export只是在当前终端中有效。所说,应该把系统代理的环境变量清空。predictor_example.ipynb这个脚本也能直接运行,就不废话了。纯python,没有C++的项目,环境简单多了。原创 2024-03-28 20:03:38 · 1361 阅读 · 0 评论 -
EfficientSAM 项目排坑
似乎预训练参数和数据都已经有了,分别在weights文件夹和figs文件夹中。看readme说有Jupyter Notebook Example,那就看看怎么用吧.看到项目里面有个setup.py,等下用他安装。readme里没有说具体怎么配置环境,所以可能对我来说还挺困难的。再运行第一步的import就每毛病了。没办法,只能去测试运行下另一个脚本。没有报错,希望后面能正常使用。这个模块现在没有了!我的电脑在1分半跑完了。差不多,到此为止吧。原创 2024-03-28 15:57:35 · 764 阅读 · 0 评论 -
mmsegmentation 项目排坑
结果还是不行,又找不到cuda了。不行就再重来,用上个项目的torch和cuda。上次算是白忙活了,这次把新版的mmsegmentation跑通。再去看官网,发现那个mvcc对应的是torch2.1.X,还没有适配2.2.X。不会用Model zoo,在上面找了半天没找到这个文件。(上次就放弃了mim安装,用pip安装的)所以没法直接用,但他说的要看config里有没有,提醒了我。下载不到,还可以下载别的这里有的。好长时间,终于装完了。这篇博客说是cuda的问题。,发现下载的要和文件名匹配。原创 2024-03-25 20:42:48 · 2654 阅读 · 8 评论 -
SegFormer 项目排坑记录
mmsegmentation要求装torch1.6.0,配套cuda10.1.这可不行,我3070显卡只能用11.0以上的cuda。从readme给的ondrive上下载segformer.b5.640x640.ade.160k.pth预训练参数文件(本来都想下载的,但校园网这个速度太慢了,先只下一个吧),然后放到根目录下创建pretrained文件夹,放到这里。CSDN上那个是full版本,但不是2.0的,而且那个命令我跑不通。因为ADE20K的官网一直没给我发账号验证邮件,我就从这里下数据集了。原创 2024-03-18 21:11:02 · 1814 阅读 · 0 评论 -
MedSAM 项目排坑记录
bin/bash有missing key还有unexpected key,感觉像是整个文件搞错了,不是某一句的问题。报错发生在查看代码可以知道medsam_lite_checkpoint来自于bash脚本提供的。查看发现缺失是有这个文件的。不知道具体错哪了,换成medsam_lite_best.pth也不对,换成work_dir/LiteMedSAM/lite_medsam.pth \就好了:但这个应该是最初下载下来的,不是我训练的。原创 2024-03-07 17:47:33 · 2798 阅读 · 28 评论 -
重装显卡驱动记录
晚上回来,开电脑,发现总是进不去系统(这个情况我经常见),但偶尔进系统,识别不了我的外接屏(这个第一次见)。来来回回重启了1h多了还是这个现象。无奈,只能重装驱动了。我打算先换成nvidia-driver-525-server这个驱动。因为老出这个问题,我就不用他更新了,我用命令行更新。现在重启一次电脑吧。还是老错误,出一个大白条。不行,没有图形界面了。原创 2024-03-06 22:23:37 · 508 阅读 · 0 评论 -
onav_rim 复现记录
大获全胜!虽然还不知道他的代码结构。但至少都能跑通了。也证明了我的电脑缺能训练这个任务的端到端网络(虽然感觉这么快有点出乎意料),训练用时接近1h。可以满意的去健身、干饭了。没有bug的一天就是美好的一天。原创 2024-03-06 17:14:34 · 983 阅读 · 0 评论 -
one4all 排坑记录
视觉语言导航是我一直想做的事情,这个项目用的也是Habitat这个仿真环境,我看很多做VLN的都用这个环境。最后是ctrl+alt+fn+f2进入tty界面,然后安装了525版本驱动再重启才好的(我用推荐的驱动没有用,最后看别人用525我也试一试没想到解决了)。打算找个star、fork人多的项目,复现一下,然后学清楚habitat的使用,再回来排错,思路会清晰很多。比较一下发现,基本都是一样的,只有两个区别:如果要bullet,就加上withbullet,如果没有显示器,就加上headless。原创 2024-03-03 21:18:46 · 1754 阅读 · 5 评论 -
ubuntu20.04 安装 matlab R2023b
但有点不一样:我现在matlab官网上下载的linux版本不是iso镜像文件,直接是一个zip压缩文件,不用什么挂载了。直接解压缩,然后在运行install文件。目前没碰到问题,在软件中找到matlab图标,点击就能运行,很方便。以后遇到matlab,不用再回到windows了~闲着没事,想在ubuntu上安装matlab。我选了否,如果以后出问题,来这里排查。这篇博客给出了解决办法。也不会出现上述报错了。原创 2024-02-23 16:19:27 · 2204 阅读 · 0 评论 -
ERROR: THESE PACKAGES DO NOT MATCH THE HASHES FROM THE REQUIREMENTS FILE. If you have updated the pa
学习d2l时候,装torch竟然报错。原创 2024-02-10 17:20:05 · 1968 阅读 · 0 评论 -
real-time-emotion-detection 排坑记录
但当时那个项目是用python3.8的虚拟环境跑的,我现在的项目的虚拟环境是python3.10,所以就会出点问题。我现在很想知道有没有对正负面情绪进行实时打分的算法,特别是基于微表情的,跑的这个情绪识别的开源算法只有做出比较刻意的表情才能被明显识别,较小的情绪变化他捕捉不到,而且波动严重,选取最大值作为主要情绪的识别是合格的,但我想要个能给舒适度打分的算法。如果有知道的大哥,麻烦指个路,多谢多谢。要么改版本,要么看新版本是不是同样的功能换了使用方法,如果新版本干脆没这个功能了,就比较棘手,可能得改版本。原创 2024-02-02 22:40:25 · 1360 阅读 · 0 评论 -
pytorch_car_caring 排坑记录
正好我还要用到RL做这个任务的代码,就在github上看了下,发现有几个,打算都跑跑,看谁效果好,代码又干净,就用谁的。本菜鸡目前只会这么硬缝。CPU和GPU可能存在异步执行的情况,这时候如果GPU报错,CPU可能不知道当时给GPU下发的什么任务,只能把自己手头上正在做的事儿当做报错信息发出去,所以可能报错是不准确的,这时候用CUDA_LAUNCH_BLOCKING=1,就可以保证CPU和GPU同步执行。然后突然想到,这是强化学习的测试,这个报错出现在网络对价值的估计上,我现在又不需要价值,我只需要动作。原创 2024-01-30 16:17:38 · 1297 阅读 · 0 评论 -
RaceCarControl 排坑记录
我需要用MPC完成gym环境下的car racing任务,记得之前看到B站一位UP在github上有开源他的实现,但那个原链接现在好像找不到了,好在github上最终找到了这个RaceCarControl项目,尝试复现他的效果,然后学习MPC,最后在他的代码基础上进行修改。opencv-python:这个包包含了OpenCV的核心模块和基本功能,但不包含一些额外的模块和功能。总的来说,这三个包都是OpenCV的Python绑定,它们在功能和包含的模块上有所不同,可以根据你的需求选择合适的包进行安装和使用。原创 2024-01-29 14:30:47 · 935 阅读 · 0 评论 -
mpmi_shared_control 排坑记录
mpmi_shared_control 排坑记录原创 2024-01-29 10:24:55 · 890 阅读 · 0 评论 -
OpenFace+Ubuntu20.04+conda 排坑记录
openface+ubuntu20.04排坑记录原创 2024-01-20 10:31:12 · 1414 阅读 · 0 评论