关于Segnet训练过程中的几个问题

最新推荐文章于 2024-02-01 19:30:12 发布

明天去哪

最新推荐文章于 2024-02-01 19:30:12 发布

阅读量7.4k

点赞数 2

分类专栏：计算机视觉论文------------------

本文链接：https://blog.csdn.net/u014451076/article/details/71052550

版权

7 篇文章 0 订阅

订阅专栏

环境

操作系统: ubuntu14.04
caffe: caffe-segnet(官方)
model: segnet-Tutorial

比较segnet_model_driving_webdemo.prototxt和segnet_inference.prototxt发现，只有卷积的权重初始化方式（w和b）和最后一层不同(webdemo为’argmax’而前者为’softmax’).
由于官方的segnet model zoo只提供了部分训练好的权重，并且一些权重存在问题(例如segnet_basic_camvid.caffemodel只有5.7M，以及bayesian_segnet_basic_camvid.caffemodel也只有6M)，而论文中说segnet的模型大小是117M，说明caffemodel上传的应该是错误的.结合问题1，暂时就使用webdemo的caffemodel进行测试.
segnet和webdemo的识别类别是不一样的，前者是11，后者是12；别切不同类别的所使用的颜色表示也是不一样的.所以需要如果使用webdemo的caffemodel对test_segmentatino_camvid.py进行预测，需要添加预测部分的颜色.可以参考https://github.com/alexgkendall/SegNet-Tutorial/issues/51.
关于如果使用webdemo进行预测，还需不需要进行batch normalization.测试了一次发现，不能使用batch normalization,如果使用bn对webdemo.caffemodel进行处理，结果变得很差.以下分别是不使用bn和使用bn获得的结果.
自己使用cityscapes的数据集进行了训练，在vgg16上进行finetune，使用cityscapes-fine数据，resize到480x240.训练了将近100轮，相关结果之后会记录.

关注