yolov5中focus的定义如下:
从图像上能够更加直观地理解
4 * 4 * 3 变成 2 * 2 * 12
x[..., ::2, ::2]意义如下图
... :表示所有通道(图中为3通道)
::2 :表示第一行开始到最后一行结束,步长为2的所有值(图中第一行,第三行所有值)
::2 :表示第一列开始到最后一列结束,步长为2的所有值(图中第一列,第三列所有值)
最终交集为图中标1的方块(图中红底标出)
torch.cat( )的用法
如果我们有两个tensor是A和B,想把他们拼接在一起,需要如下操作:
C = torch.cat( (A,B),0 ) #按维数0拼接(竖着拼)
C = torch.cat( (A,B),1 ) #按维数1拼接(横着拼)