与之前SiameseFC(预测 score 的方法)、SiameseRPN(做 bounding box regression)都不太相同,是增加了一个mask来过得可以实时旋转的bounding box,从而来提升精确度的,这的确也更符合精准度的提升。
SiamMask思路:从图一,通过Depth-Wise Cross-correlation(d)获得了17x17x256的特征图, 我们以该特征图为输入,通过2个1x1卷积(hф),提升特征图的维度至 6363。然后我们沿着维度所在的dim,将 1717(6363)的特征图分为17x17个RoWs(response of a candidate window) , 希望获得的17x17个RoWs中能够有一个RoW,他包含了mask的全部信息。如图二所示,然后通过这个RoW中的信息(维度为 116363),将其映射回原图大小,利用了上采样和skip connections提高分割精度,获取了物体的mask信息。根据mask选择最小外接矩阵,为其bounding box即可。
SiamMask论文资源
于 2021-10-13 10:28:36 首次发布