ReID实战推荐——罗浩——常用的骨干网

课程中常用的代码句

1. pid, _ = map(int, pattern.search(img_path).groups())#当后面的语句返回多个东西时,我只想要一个值,就可以用‘_’来不取
2. from IPython import embed#加断点,查询网络的进展情况
        embed() #可同时加多个embed,用exit退出到下一个embed 
3.in_size=x.size(0)#x会返回(b,c,w,h)这里返回第一个维度batch的大小
4.torch.cat(outputs,dim=1) #输出size[b,c,w,h],所以dim=1沿着第一个维度C拼接
5.input=torch.Tensor(input).view(1,1,5,5)#B*C*W*H压缩成4维
  f = x.view(x.size(0), -1)#将x变成2维,第一维大小为x.size(0)=batch,第二维(-1)自动压缩
6.x.shape#查看tensor的大小
7.conv_layer.weight.data = kernel.data #直接对某个层.weight.data赋值
8.self.base = nn.Sequential(*list(resnet50.children())[:-2])#不要restnet50的最后两行,自己添加下面两行
#用nn.Sequential来包裹model的两层参数,每次更新只更新这两层
    # optimizer = init_optim(args.optim, nn.Sequential([model.conv1,model.conv2])
9.调试代码时,可自己生成数据
只有torch.Tensor,torch.randn用来生成数据,torch.tensor(labels)是转化为tensor数据格式
imgs=torch.Tensor(32,3,256,128)#全0矩阵
x = torch.randn(32,2048)#均值为0的矩阵
labels=torch.Tensor(labels)#生成数据带点
labels=torch.tensor(labels)#生成数据不带点
10.assert len(x.size()) == 3#判断上面的输入是不是3维
11.调用要从最初的文件夹开始:from luohao_person_reid.AlignedReID_master.aligned.local_dist import *
12. # 保存网络训练最好的权重
    best_model_wts = copy.deepcopy(model.state_dict())
    best_acc = 0.0
    # 保存测试阶段,准确率最高的模型
 if phase == 'val' and epoch_acc > best_acc:
    best_acc = epoch_acc
    best_model_wts = copy.deepcopy(model.state_dict())
 model.load_state_dict(best_model_wts)# 最后网络导入最好的网络权重
 13.[model.state_dict()和model.parameters()两个方法的差异比较](https://blog.csdn.net/qq_33590958/article/details/103544175?biz_id=102&utm_term=model.state_dict%28%29%E5%92%8Ccnn.paramet&utm_medium=distribute.pc_search_result.none-task-blog-2~all~sobaiduweb~default-0-103544175&spm=1018.2118.3001.4187)
 14. a=torch.Size([32, 3, 128, 128]),a[0]=torch.Size([3, 128, 128])取出第一张图片的信息
 15. 两种save图片方式对比:数据类型不同,通道不同
 法1:
 image_PIL = transforms.ToPILImage()(image_tensor[0])#取出第一张图片image_tensor[0].shape=torch.Size([3, 128, 128]) 
 image_PIL.save(os.path.join(config.result_path, 'img%d.png' % (i + 1)))
 type(image_PIL)=PIL.Image.Image   <PIL.Image.Image image mode=RGB size=128x128 at 0x205F779ACF8>2:
 cv2.imwrite(os.path.join(config.result_path, 'cam%d.png' % (i + 1)), result)#(128, 128, 3),result=numpy.ndarray
a=tensor a.numpy()变成numpy

罗浩github---------ReID课程教学

1. Reid简介

在这里插入图片描述
在这里插入图片描述
数据集

一次投放5个样本,一个样本只检测出一次。

在这里插入图片描述
rank1+rank2+rank3+…=CMC
在这里插入图片描述
在这里插入图片描述

难样本提取

在这里插入图片描述

rank+map计算

在这里插入图片描述

center loss

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

2. 表征学习

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

3. 度量学习

度量学习不需要表征学习的FC(用来分类),直接对比特征图就行
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
python实现距离矩阵,用于难样本的选择
在这里插入图片描述
在这里插入图片描述

import torch
inputs=torch.tensor([[1.,1.,2.],#这里注意tensor数据类型数字要加点,否则后面运算会出现错误RuntimeError: log_vml_cpu not implemented for 'Long'
             [1,0,1],
             [1,2,1],
             [1,3,2]])
dist = torch.pow(inputs, 2).sum(dim=1, keepdim=True).expand(4, 4)
dist = dist + dist.t()
dist.addmm_(1, -2, inputs, inputs.t())

dist=dist.clamp(min=1e-12).sqrt()#裁剪防止有0存在,梯度会存在问题
print(dist)

在这里插入图片描述

4. 全局特征+局部特征

  1. 全局
    在这里插入图片描述
    在这里插入图片描述
  2. 局部
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

1. 水平切块算法

在这里插入图片描述

Aligned ReID

这种情况更适合真实的环境(不对齐现象),而用的数据集是经过手动处理过的。
在这里插入图片描述
在这里插入图片描述
实现
在这里插入图片描述
我认为DMLI只用用于解释才产生的这个名词,代码直接将32x128x8变成32x8x128用于local distance训练,并未体现DMLI
在这里插入图片描述
在这里插入图片描述

PCB

Aligned和PCB都是经过水平池化生成g
不同之处Aligned用vector_h 生成距离矩阵,用于hard triple loss
PCB将vector_h 的多个分支送到FC,用于ID交叉熵loss
在这里插入图片描述
PCB_github
在这里插入图片描述

ICNN

在这里插入图片描述

SCP NET

在这里插入图片描述

2. 姿态信息

在这里插入图片描述

PIE

在这里插入图片描述

SPINDLE NET

在这里插入图片描述

PDC

在这里插入图片描述

GLAD

在这里插入图片描述

PABP

前面几种是part级别,PABP是像素级别
在这里插入图片描述

3. 分割信息

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
SPReID
在这里插入图片描述

4. 网格特征

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

5. 序列重识别

在这里插入图片描述
在这里插入图片描述

提取序列特征的方法
1.
在这里插入图片描述
2.
在这里插入图片描述

6. 基于GAN

在这里插入图片描述
不同GAN解决不同问题
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
应用于ReID

GAN+LSRO

在这里插入图片描述

Cycle Gan

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

PTGAN

在这里插入图片描述
在这里插入图片描述

PNGAN(生成8姿态)

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

7. Ptorch应用

tensorflow静态图,只能看到是结点,但是不知道结点里是啥
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

8. 工程trick

在这里插入图片描述

  • 6
    点赞
  • 24
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值