一面:
介绍一下项目(你参与度最高的)
问:Pooling知道吧?我们在做cv的时候,图像经常是不同size的,我们在训练的时候经常通过crop图片取得同size的输入数据。但是训练的时候,输入是整张图,【这样会造成什么后果呢?】用没有什么办法可以解决这个问题呢?即测试的时候如何有效利用整张图的信息?
答:测试的时候也crop,每个croped图片有一个预测结果,通过投票的形式得到最后结果。
问:因为crop是overlapping的,这种方式会造成在部分图片区域上的重复卷积,增加计算复杂度,有没有办法解决这个问题?
答:在卷积输出层,也就是fc层前进行crop(但是网络结构不能改变)
问:怎么做呢?举个例子,原来是8x8x128的卷积输出层,换成全图之后,是10x12x128的卷积层,怎么连接到fc1层(假设是20维的)?
答:(在提示下)用20