![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
bug
STU_11wxzou
志存高远,虚怀若谷。
展开
-
tensorrt ImportError: No module named ‘tensorrt‘
ImportError: No module named 'tensorrt'原创 2022-03-31 20:04:56 · 6735 阅读 · 0 评论 -
Nvidia Jetson NX 使用tensorrt, ModuleNotFoundError: No module named ‘tensorrt’
nvidia nx tensorrt原创 2021-11-25 11:56:32 · 2644 阅读 · 0 评论 -
darknet 段错误(核心已转储)(Segmentation fault) mosaic=1-compile Darknet with Opencv for using mosaic=1
darknet训练 yolo 遇到的问题。在cfg文件,mosaic改成0,即可训练原创 2021-11-18 20:13:53 · 2516 阅读 · 0 评论 -
ubuntu 18.04 重启nvidia显卡驱动nvidia-smi has failed
安装好对应版本的nvidia显卡驱动和cuda,某次重启之后,机器分辨率异常,终端输入 nvidia-smi,显示:nvidia-smi has failed because it couldn't communicate with the nvidia driver. make sure that the latest nvidia driver is installed and running.查找一番,原因是因为Linux更新都是为了修复之前内核的bug,提供一些新的特性,内核更新了,显卡驱原创 2021-02-02 14:35:50 · 2011 阅读 · 0 评论 -
NVIDIA 显卡使用出现的问题
跑深度学习模型,离不开显卡。最近公司淘汰旧显卡,配了GTX 2060 SUPER给客户,装机的时候,发现一些问题。1. 显示器不支持热插拔:开机后再插HDMI,显示器没显示;必须开机前插上,而且中途拔插没有显示2. 开机登录界面非常卡:安装了ubuntu18.04的系统,厂家说要升级20.04,升级之后仍然很卡。于是。。。。把显卡拆了,排查显卡的问题。把2060 SUPER的显卡,换成了1660SUPER,问题解决了。...原创 2020-11-30 10:59:40 · 1145 阅读 · 1 评论 -
无法访问github.io (Ubuntu解决办法)
sudo vim /etc/resolv.conf把127.0.1.1改成 8.8.8.8即可登录github,io原创 2020-09-21 15:50:31 · 2075 阅读 · 1 评论 -
docker run 和start 一个容器时,容器闪退
部署的时候遇到一个问题,run一个容器时,容器立马闪退。原因是,容器里会检测有没有进程在运行,如果没有,就自动关闭容器。有两种方法解决:1. 如果要在容器里运行某程序,此程序的服务需要手动终止,那么可以在 docker run的时候加上 bash -c "运行的程序的命令",比如,我进入容器里要在当前目录下运行 "python server.py", 那么就docker run --runtime=nvidia -p 6060:8080 -it -d -v /home/a:/mmdetecti原创 2020-08-28 16:50:01 · 1846 阅读 · 0 评论 -
解决模型训练loss nan的问题
用mmdetection训练检测模型时,出现了bbox_loss和cls_loss nan的问题,记录排查原因的过程,以及最终的解决。现象是,loss 在正常降低的过程中,突然跳变nan,整体震荡下降。1. 调小学习率一般出现loss nan,无非是网络传输的梯度过大导致的,所以首先考虑减小模型的学习率。可是学习率调小100倍甚至10000倍,还出现nan的情况,所以考虑其他原因导致。先排除学习率的影响,将学习率设为0,loss依旧nan,然后就可以尝试下一个了。2. 梯度裁剪在学习率为0的原创 2020-08-03 14:32:54 · 6939 阅读 · 12 评论 -
RuntimeError: The size of tensor a (30) must match the size of tensor b (81) at non-singleton
用mmdetection训练cascade_rcnn模型时,训练时没有问题,在validation的时候报错Traceback (most recent call last): File "prepare_mmdet_detections_txts.py", line 36, in <module> bboxes, labels = image_detections(image_path) File "prepare_mmdet_detections_txts.py", l原创 2020-07-31 14:29:00 · 8029 阅读 · 0 评论 -
查看英伟达显卡信息,解决nvidia-smi命令报错
跑训练的时候,提示cuda不存在,nvidia-smi报错:NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.装过nvidia 显卡驱动了,nvidia-smi报错,避免重装驱动的繁琐,找到以下解决方案:先查看自己之前安装的驱动版本ls /usr/src原创 2020-07-31 14:14:21 · 2195 阅读 · 0 评论 -
运行selenium爬虫脚本时遇到关于chrome的问题
一个使用selenium的爬虫脚本,运行时报错:selenium.common.exceptions.WebDriverException: Message: 'chromedriver' executable needs to be in PATH. Please see https://sites.google.com/a/chromium.org/chromedriver/home这是因为缺少chrome驱动,安装上:sudo apt-get install chromium-c原创 2020-07-21 16:47:39 · 387 阅读 · 0 评论 -
mmdetection报错:AttributeError: ‘VOCDataset‘ object has no attribute ‘dataset‘
训练验证时,报错: File "/home/user/mmdetection/mmdet/datasets/voc.py", line 43, in evaluate ds_name = self.dataset.CLASSESAttributeError: 'VOCDataset' object has no attribute 'dataset'查了下是mmdetection的一个bug, 在voc.py里的 self.dataset.CLASSES去掉dataset,改为ds..原创 2020-07-16 11:41:36 · 3265 阅读 · 0 评论 -
模型训练报错AttributeError: ‘NoneType‘ object has no attribute ‘text‘
用pascal voc数据格式,mmdetection训练模型时报错AttributeError: 'NoneType' object has no attribute 'text',定位在xml_style.py-----> difficult = int(obj.find('difficult').text)原因是标注文件 .xml的<object>没有<difficult>的标签。difficlut表明这个待检测目标很难识别,有可能是虽然视觉上很清楚,但是没有上下文的原创 2020-07-16 11:29:38 · 11925 阅读 · 9 评论 -
ubuntu 启动 meld、diffuse失败
两种方法:1. 把python版本回退到python22. 修改meld使用python2启动。cd /usr/binsudo vim meld修改#!/usr/bin/python2只要出现无法启动软件的问题,都可试试这个方法。原创 2020-07-03 17:39:57 · 855 阅读 · 0 评论 -
mmdetection解决 ImportError: cannot import name ‘deform_conv_cuda’
原因是mmdetection版本问题,查了很久最后在mmdetction github的issue里找到一个解决方案,附上链接:https://github.com/open-mmlab/mmdetection/issues/413#issuecomment-515299000最后想说的是,对于开源工具,安装和使用过程遇到各种问题,可以先在原github的issue找找答案,大家往往都会在上面有反馈。...原创 2020-06-10 11:03:15 · 14842 阅读 · 4 评论 -
解决 vscode 打不开终端的问题,报错 The terminal process terminated with exit code: {0}
vscode 突然打不开终端,报错The terminal process terminated with exit code: {0} ,找了一会,最后在 stack overflow 找到一个相关的关键词,Malwarebytes拦截。加域的电脑里一般都有这个Malwarebytes,在控制面板->卸载程序 找到Malwarebytes卸载掉,重启vscode,解决了。...原创 2020-03-27 22:12:51 · 8957 阅读 · 1 评论