[FoveaNet]FoveaNet: Perspective-aware Urban Scene Parsing

Abstract

清华大学和一些企业合作的文章,发表于ICCV 2017.文章主要

目前,大多数的图片解析模型都将所有尺寸和位置的信息同等对待,而没有考虑汽车捕获的城市场景图片的几何属性. 因此,由于摄像头的透视投影,会导致存在不同的物体尺寸,并且不可避免地造成场景解析和识别错误.

本方法在Cityscapes和Camvid上达到了SOTA.

本文的主要贡献:(1)提出透视评估网络来学习城市街景图片中的全局透视几何信息(2)提出考虑透视的解析网络进行城市街景中差异化尺寸问题的解决方法(3)提出考虑透视的CRFs模型来减少大尺寸物体存在的“分解”问题.

Movitation

1
在摄像头下近的物体拍出来比较大,远的物体拍出来比较小,然而在现实中可能是同样大小的物体.通常的分割方法,由于忽略了这种信息,常常导致将一个大的物体分解,同时小的物体边界也容易产生错误. 因此考虑提出FoveaNet结合这种信息.

Frame

2
主要想法是预测一张图片中的透视几何,然后对不同尺寸的信息进行不同的解析,而不是统一解析.

  1. 考虑透视的评估网络
    主要是更好的解析消失点附近的小尺寸物体聚集区域.

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值