深度学习
文章平均质量分 84
superjfhc
这个作者很懒,什么都没留下…
展开
-
deepsort跟踪的基本流程
目录基本概念成员基本流程本篇文章主要梳理deepsort跟踪的基本流程,不会具体讲解所有细节,但是基本的环节都不会遗漏。基本概念匈牙利算法匈牙利算法也可以称之为最小权重匹配,给一个矩阵,每一行至多与一列匹配,每一列也至多与一行匹配,当所有行或者列都匹配结束后,使匹配的结果之和最小。>>> cost = np.array([[4, 1, 3], [2, 0, 5], [3, 2, 2]])>>> from scipy.optimize import linear原创 2021-03-13 19:52:23 · 1550 阅读 · 0 评论 -
【技术文档】HRNet姿态估计
目录模型结构augmentloss模型结构class PoseHighResolutionNet(nn.Module):def __init__(self, cfg, **kwargs): self.inplanes = 64 extra = cfg['MODEL']['EXTRA'] super(PoseHighResolutionNet, self).__init__() # stem net self.conv1 = nn.Conv2d(3, 64,原创 2020-12-25 21:21:42 · 575 阅读 · 0 评论 -
优化器:SGD > Momentum > AdaGrad > RMSProp > Adam
目录SGD 随机梯度下降momentumAdaGradRMSPropSGD 随机梯度下降在这里SGD和min-batch是同一个意思,抽取m个小批量(独立同分布)样本,通过计算他们平梯度均值。后面几个改进算法,均是采用min-batch的方式。momentum1.动量方法主要是为了解决Hessian矩阵病态条件问题(直观上讲就是梯度高度敏感于参数空间的某些方向)的。2.加速学习3.一般将参数设为0.5,0.9,或者0.99,分别表示最大速度2倍,10倍,100倍于SGD的算法。4.通过速度v原创 2020-12-25 20:48:30 · 840 阅读 · 0 评论 -
【技术文档】centernet(姿态估计)
目录模型结构backbone dla34模型结构backbone dla34dla(Deep Layer Aggregation)We introduce two structures for deep layer aggregation (DLA): iterative deep aggrega-tion (IDA) and hierarchical deep aggregation (HDA).Hierarchical deep aggregation merges blocks and s原创 2020-12-23 20:18:52 · 2065 阅读 · 2 评论 -
【技术文档】yolact
目录模型结构backboneblockFPNheadprotonet最终的输出结果形势traincfgmatch模型结构backbone模型的backbone是res50,主要由四个layers组成,在输入进入每个layer之前,需要经过nn.Conv2d(3, 64, kernel_size=7, stride=2, padding=3, bias=False),norm_layer(64),nn.ReLU(inplace=True)和nn.MaxPool2d(kernel_size=3, stri原创 2020-12-22 20:26:06 · 842 阅读 · 1 评论 -
【技术文档】RetinaFace(详细版)
模型结构组成backbone的子结构def conv_bn(inp, oup, stride = 1, leaky = 0): return nn.Sequential( nn.Conv2d(inp, oup, 3, stride, 1, bias=False), nn.BatchNorm2d(oup), nn.LeakyReLU(negative_slope=leaky, inplace=True) )def conv_bn_no_r原创 2020-12-20 12:46:21 · 2562 阅读 · 4 评论 -
pytorch模型转torchscript
文章目录目的方法tracescript目的将pytorch模型转化成torchscript目的就是为了可以在c++环境中调用pytorch模型。pytorch官方链接方法共有两种方法将pytorch模型转成torch script ,一种是trace,另一种是script。一版在模型内部没有控制流存在的话(if,for循环),直接用trace方法就可以了。如果模型内部存在控制流,那就需要用到script方法了。trace通过使用示例输入对模型的结构进行一次评估,并记录这些输入在模型中的变化过程原创 2020-10-11 11:30:45 · 12780 阅读 · 10 评论 -
【技术文档】RetinaNet
RetinaNet的特点就是应用了FocalLoss。该模型大小为80M。数据读取我使用的数据是依然是crowdhuman,将其整理成VOC格式,也就是图片路径放入一个json文件,标注放到一个标注文件。该模型并没有设置背景类,若模型只检测行人这一个类的话,那么类别索引就是0,若有两个类,那么类别索引就是0,1。annotations = np.zeros((0, 5))for box ...原创 2020-12-18 10:40:46 · 486 阅读 · 0 评论 -
【技术文档】RetinaFace
RetinaFace模型原本是作者用于检测人脸,但我将其用于行人检测。我只是简单的将其anchor的宽高比例由原来的1:1,变为现在1:2.25,只有这一种比例,只是在FPN每个位置会有两个不同大小的,该比例的anchor。模型的特点就是比较小(4M)。configcfg_mnet = { 'name': 'mobilenet0.25', 'min_sizes': [[16, ...原创 2020-12-18 10:41:48 · 1827 阅读 · 1 评论 -
【人脸识别项目一】:眨眼检测
项目背景眨眼检测是我在卓朗科技实习期间做的第二个项目,这个项目做了大概一个多月的时间,从2019/7/21到2019/8/28才算基本完成眨眼检测的算法模型。眨眼检测主要用于上班的打卡软件上,有的打卡软件上有人脸识别,通过眨眼识别可以防止有人通过照片冒充人脸欺骗打卡软件,另一方面也可以通过眨眼拍照增加用户与打卡产品的互动性,使员工的打开过程更加方便。项目过程dlib关键点检测眨眼的定义...原创 2019-08-28 15:08:13 · 16414 阅读 · 15 评论