鸽了好久,好久没写文章了,主要是一个技术难题,刚入手确实比较困难,所以一直在调试(打游戏),终于在 Colab 上把 RGB 三通道的图像的建筑物轮廓给跑出来了。先看一组效果图吧!
原图
推理图
轮廓图
卡脖子的难点
在使用的时候遇到了好多问题,而最关键的还是自己没有仔细看官方的 tutorial 中有两行很小的注释,推理的时候 cfg 需要使用和训练时候一样的参数,并添加额外的参数。所以一直报错。
# Inference should use the config with parameters that are used in training
# cfg now already contains everything we've set previously. We changed it a little bit for inference:
情况是什么呢?就是如果电脑重新启动了或者变量消失了,如果直接用官方 tutorial 中的 inference 代码,发现加载权重还是会错误,要么出现随意乱框的 box ,要么找不到某一个字段,错误是 Cannot find field "pred_masks" in the given Instances!
。因为没有加载原来训练时候的 cfg 预设的参数!
流程
本来不想再贴一次代码的,但是为了完整性就慢慢贴吧,也可以看后面录的视频!
# install dependencies: (use cu101 because colab has CUDA 10.1)
!pip install -U torch==1.5 torchvision==0.6 -f https://download.pytorch.org/whl/cu101/torch_stable.html
!pi