“未来会怎样”
“要用力走下去才知道”
“路还长 天总会亮”
2018遂将毕矣~
期待再见!
深度学习增加了计算机视觉的前所未有的准确性,比如图像分类,目标检测,当然还有分割。
对于分割,之前博文曾总结了其两种形式:语义分割、实例分割。
然而,在智能驾驶以及移动设备领域,除了算法的精度要求,算法的实时性也是极其重要。对于实例分割,不仅需要对不同语义物体进行图像分割,同时还要求对同一语义的不同个体进行分割(即要对每一个像素进行区分,更要对同一类目标的不同个体用不同颜色分别标示出来),这么高的需求就意味着需要更复杂的网络,更繁琐的浮点计算,更长的耗时,更高的计算平台,比如MaskRCNN,虽然在效果上很好,但离实际的工程应用还有一段距离。相反,语义分割,好像更接地气,无论是精度和实效性,都可以接受,因此更受开发者的喜爱,尤其是在感知领域,其炫酷的分割结果可以很好的吹逼呦,哈哈~
注:图片借鉴某司官网,致谢,见谅~
好,接下来就详细总结下语义分割的经典的三个网络:FCN、SegNet、E-Net
一般的语义分割架构可以被认为是一个编码器——解码器网络(一个encoder一个decoder)。编码器通常是一个预训练的分类网络,像 VGG、ResNet&