torch
平丘月初
这个作者很懒,什么都没留下…
展开
-
GRU学习笔记
和上一个节点传递下来的隐状态(hidden state)GRU的输入输出和普通RNN一样。,这个隐状态包含了之前节点的相关信息。,GRU会得到当前隐藏节点的输出。和传递给下一个节点的隐状态。原创 2022-09-27 16:49:41 · 1064 阅读 · 0 评论 -
2D&3D Pose数据集
2d&3D Pose数据集2D数据集COCOAICMPIICrowdPoseOCHuman3D数据集Human36M功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入2D数据集你好! 这是你第一次使用 Markdown编辑原创 2022-03-30 11:45:32 · 829 阅读 · 0 评论 -
yolov5-face
networkdataloader__getitem__()\_\_getitem\_\_()__getitem__()时,对每张图片,对应标注的数据维度为[num_objects,14][num\_objects, 14][num_objects,14],每一行的数据格式为[x, y, w, h, x1, y1, x2, y2, x3, y3, x4, y4, x5, y5]. 前四个为归一化的人脸bbox的中心和宽高,后面10个为归一化的人脸5点关键点的坐标。读入并进过一系列数据增强后,再将bbo原创 2021-12-02 15:10:59 · 4820 阅读 · 0 评论 -
RetinaFace解析
网络结构SSH模块通过级联的3x3卷积来模拟5x5和7x7更大的感受野,最后聚合输出out_channel通道数的特征图。Head部分classificationbboxlandmark原创 2021-11-30 21:34:00 · 1245 阅读 · 0 评论 -
常用激活函数解析
sigmoid 和 ReLUsigmoid(x)=11+e−xsigmoid(x) = \frac{1}{1+e^{-x}}sigmoid(x)=1+e−x1sigmoidsigmoidsigmoid激活函数的问题是随着输入趋近±∞\pm\infty±∞时,梯度会迅速变为0,梯度回传时,浅层的参数无法得到有效更新。ReLU(x)=max(0,x)ReLU(x) = max(0, x)ReLU(x)=max(0,x)ReLUReLUReLU在x>0时,梯度恒为1,不会存在梯度消失问题。在x&l原创 2021-11-19 15:02:49 · 366 阅读 · 0 评论 -
VIBE流程
main包含了DataloadersDataloadersDataloaders, Compile LossCompile\;LossCompileLoss, Initialize networks, optimizers and lr_schedulersInitialize\;networks,\;optimizers\;and\;lr\_schedulersInitializenetworks,optimizersandlr_schedulers, Start TrainingStar原创 2021-10-19 16:31:48 · 623 阅读 · 0 评论 -
SPIN流程
# No reduction because confidence weighting needs to be appliedself.criterion_keypoints = nn.MSELoss(reduction='none').to(self.device)keypoint_lossdef keypoint_loss(self, pred_keypoints_2d, gt_keypoints_2d, openpose_weight, gt_weight):""" Compute 2D r原创 2021-10-15 17:36:20 · 380 阅读 · 1 评论 -
有趣的torch.einsum
import torchimport numpy as npa = torch.arange(9).reshape(3, 3)提取矩阵对角线元素out = torch.einsum('ii->i', a) # tensor([0, 4, 8])矩阵转置out = torch.einsum('ij->ji', a)out = torch.einsum('...ij->...ji', a) # 高维矩阵最后两维转置reduce sumout = torch.einsum原创 2021-10-15 16:04:33 · 419 阅读 · 0 评论 -
smplify
smplify是一个基于模型的优化过程。Step 1只优化相机平移和身体朝向。camera_translation = init_cam_t.clone()global_orient = init_pose[:, :3].detach().clone()camera_opt_params = [global_orient, camera_translation]camera_optimizer = torch.optim.Adam(camera_opt_params, lr=self.step_原创 2021-10-15 11:35:02 · 691 阅读 · 0 评论 -
SMPL模型
SMPL的python版本在官方网站有两个,分别是SMPL_python_v.1.0.0,SMPL_python_v.1.1.0。区别是:以SMPL_python_v1.1.0为例,其中包含了三个models和操作models的基础脚本。三个模型是male,female,netrual的pkl格式模型,以netrual为例,我们看下其中的数据结构。import picklewith open(model_path, 'rb') as f: smpl = pickle.load(f, encodin原创 2021-10-14 11:36:28 · 3464 阅读 · 1 评论 -
DGF网络
DGFDeep Guided Filtering Network的目标是利用低的计算代价,生成全分辨率,并保留边缘特征的输出。采用coarse-to-fine的思路。下采样原始输入图像IhI_hIh, 得到低分辨率输入IlI_lIl。输入到CNN中Cl(Il)C_l(I_l)Cl(Il),得到对应的低分辨率输出OlO_lOl。然后以IlI_lIl, IhI_hIh, OlO_lOl作为输入,生成最终的全分辨率输出OhO_hOh。DGFSDGF_SDGFSCl(Il)C_l(I_l原创 2021-10-11 15:07:11 · 390 阅读 · 0 评论 -
通过detectron2学习AI
Norm目前detectron2中提供的归一化方式有:norm = { "BN": BatchNorm2d, # Fixed in https://github.com/pytorch/pytorch/pull/36382 "SyncBN": NaiveSyncBatchNorm if env.TORCH_VERSION <= (1, 5) else nn.SyncBatchNorm, "FrozenBN": FrozenBatchNorm2d, "GN": lambda channel原创 2021-09-06 18:02:20 · 990 阅读 · 0 评论 -
mmpose使用笔记
环境配置xtcocoapi, poseval需要从github下clone安装,mmcv可以直接通过pip install安装。这里主要介绍下top-down方案的使用过程。demo我不想install到全局路径中,故每次使用时,需要export一下mmpose的路径。如下:export PYTHONPATH=path_to_your_mmpose_folderimage demopython demo/top_down_img_demo.py \configs/body/2d_kpt_s原创 2021-08-11 14:21:54 · 1226 阅读 · 0 评论 -
yolov5
网络结构以coco数据集为例,合计80类。yolov5在stride为8, 16, 32这三个维度上分别检测小目标,中目标,大目标。在每个尺度的每个位置上铺num_anchors个anchor。正常来说,num_anchors=3。假设输入图片的尺寸为[N, 3, H, W],这三个stride上输出特征图的尺寸分别为:[N, num_anchors, H/8, W/8, num_classes + 5][N, num_anchors, H/16, W/16, num_classes + 5]原创 2021-08-10 11:52:34 · 6034 阅读 · 0 评论 -
交叉熵损失
交叉熵损失BCELossBCEWithLogitsLossCrossEntropyLossBCELoss全称为Binary CrossEntropy Loss,二值交叉熵损失。l(x,y)={l1,...,lN}Tl(x, y) =\{l_1,..., l_N\}^Tl(x,y)={l1,...,lN}Tln=−wn[ynlog(xn)+(1−yn)log(1−xn)]l_n = -w_n[y_n log(x_n) + (1-y_n)log(1-x_n)]ln=−wn[ynlog原创 2021-08-09 21:33:36 · 1766 阅读 · 0 评论 -
PointRend解析
目录模型结构backboneproposal_generatorroi_headsbox_poolerbox_headbox_predictormask_coarse_headmask_point_head如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入模型结构用的是G原创 2020-12-16 20:46:42 · 776 阅读 · 1 评论 -
python3正确加载python2训练的pth模型
torch.load 加载预训练模型时出现报错:UnicodeDecodeError: 'ascii' codec can't decode byte 0xe9 in position 6: ordinal not in range(128)经过查找发现,model是在python2.7上进行训练,现在在python3.6上进行infer,因为版本的原因出错.解决办法:在加载模型前加入from functools import partialimport picklepickl原创 2020-08-12 20:56:56 · 685 阅读 · 1 评论