Annotating Object Instances with a Polygon-RNN
CVPR2017
project page: http://www.cs.toronto.edu/polyrnn/
这里主要提出一个制作真值数据的工具。如下图所示:
这里我们使用VGG网络提取特征,使用一个 Convolutional LSTM 进行物体轮廓的提取。
我们的模型之所以是 RNN,是因为它每次只预测一个节点vertex。 每个步骤 RNN 的输入是: 图像块的CNN特征,前两个步骤预测的vertices 和第一个节点。 用前两个步骤的节点来预测下一个节点。第一个节点用于判断polygon 是否结束。 这里的CNN提取的特征倾向于 物体的边缘信息。RNN 用于跟踪这些边缘。
在RNN中我们可以随时加入人工标记信息。