- 最近已经到了需要改源码的地步了,不得不研究研究YOLO的结构,这就涉及到pytorch的各种api
range和arange
- 创建1维张量
- 这里给出一段示例:
z = torch.range(1,10)
print(z,z.shape)
z = torch.arange(1,10)
print(z,z.shape)
- torch.range(1,10)和 torch.arange(10)都产生了一个1维的数组,类型是 <class ‘torch.Tensor’>
- 二者不同的是
- range产生的长度是10-1+1=10 是由1到10组成的1维张量,类型float
- 而arange产生的是10-1=9 由1-9组成的1维度张量 ,类型int
- 二者不同的是
他们的输出分别是
tensor([ 1., 2., 3., 4., 5., 6., 7., 8., 9., 10.]) torch.Size([10])
tensor([1, 2, 3, 4, 5, 6, 7, 8, 9]) torch.Size([9])
- 示例2:
# z = torch.range(10)
# print(z,z.shape)
z = torch.arange(10)
print(z,z.shape)
- 需要注意的是,range第一个值不能缺省,arange可以,默认0,其输出就是:
tensor([0, 1, 2, 3, 4, 5, 6, 7, 8, 9]) torch.Size([10])
repeat
- 复制张量
z = torch.arange(10)
print(z,z.shape)
z = torch.arange(10).repeat(10,1)
print(z,z.shape)
- 这次我们先给输出:
- 可以看到repeat就干了一件事,复制,那么其复制的机制就是:得到[10,10x1]的张量,内容为复制出来的
- 如果吧repeat参数改为repeat(10,5,2),那么就会懂得到[10,5,2x10]=[10,5,20]的张量,换句话说,repeat的最后一个参数,决定要复制的张量的基本元素,和前n-1个一起决定复制成什么样的矩阵。
View
- 改变张量形状
- View的机制顺序地拿数据填充形状,注意,定义的形状所需要的数据的数量必须=能提供的数据数量
- 比如:[10x10] 的张量可以.view(1,1,10,10) 也可以.view(5,20) 但是不可以.view(10,11) ,一旦数据数量不同,就会报数据无效的错误
- 代码示例
z = torch.arange(10)
print(z.shape)
z = torch.arange(10).repeat(10,1)
print(z.shape)
z = torch.arange(10).repeat(10,1).view(1,1,10,10)
print(z,z.shape)
最终效果
- 我看这部分的目的是想做矩形推理,理论上我只要给z = torch.arange(10).repeat(10,1).view(1,1,10,10)传上正确的且比例不同的参数,那么我就可以得到矩形的tensor,就比如:
image_size=(416,320)
z = torch.arange(image_size[0]).repeat(image_size[1], 1)
print(z.shape)
z = torch.arange(image_size[0]).repeat(image_size[1], 1).view([1, 1, image_size[0], image_size[1]])
print(z.shape)
- 我就可以得到这俩张量,恰好对应image的形状
torch.Size([320, 416])
torch.Size([1, 1, 416, 320])
- 那么由此,我在padding的时候就可以不padding成一个416x416的正方形,而是可以是复合一定条件的矩形。理论上是会加速边缘设备的推理速度