- 博客(11)
- 收藏
- 关注
原创 Caffe 数据增强源码解读--数据层与data_transformer
深度学习训练中数据是基础,为了让模型的训练效果更好,泛化性能更强,数据增强是一种广泛采用的技巧。 但是caffe官方的实现的一些数据输入层比如DataLayer、ImageDataLayer层所支持的数据增强操作实在比较有限,因此这里解读一下caffe中数据增强部分的代码,并分析如何修改源码增加数据增强的功能(主要是指明修改思路)一、数据层相关的类图关系 Ca...
2019-01-24 14:00:56 1103
原创 人脸特征提取模型(细致分析对比分析)-基于LFW数据集
动机 总所周知,LFW数据在人脸特征提取模型的验证上是一个基本的标杆,目前大部分的方法在上面的效果已经都超过了99%的验证准确度,但是单纯的测试模型在上面的准确度,并不能分析出模型的性能到底好多少?到底好在什么方面?(因为大部分模型的验证精度都差别很小了)。 出于以上原因,为了对比不同模型具体性能的差异,设计了如下分析方案: ...
2019-01-12 14:08:28 7364 3
原创 FAN 训练复现(独立实现数据准备与训练部分的代码)
由于原作者的FAN-2D模型中,是基于一个头网络+4个Hourglass模块,在Titan X上需要43-50ms的处理时间。为了提高一些模型速度,这里尝试重新压缩简化一下模型,只采用2个Hourglass模块。 由于作者并未开放pytorch版的训练源码,因此根据自己的理解重新实现训练代码,并进行训练验证。数据集准备 计划使用300W-LP数据集。并根据数据集生...
2019-01-04 17:12:24 901 3
原创 FAN 2D/3D人脸关键点预测论文解读
论文全称为: How far are we from solving the 2D & 3D Face Alignment problem? (and a dataset of 230,000 3D facial landmarks)简介 ICCV 2017的论文,结合最先进的人脸特征点定位(landmark localization)架构和最先进的残差模块(residu...
2018-12-25 13:44:07 4158
原创 Combined Margin loss人脸识别训练笔记
利用caffe第三方实现的combined margin_layer进行训练(https://github.com/gehaocool/CombinedMargin-caffe),数据集采用VGGFace2,经过筛选以后共有8631个人的244W+的人脸图片。 训练过程中出现了一下问题,这里进行记录。一、利用开源项目中的res36-E网络进行训练 训练过程比较顺利,...
2018-12-25 09:50:21 2448
原创 (Caffe人脸识别)CosineFace、ArcFace、MobileFaceNet、Combined Margin loss的原理以及在caffe中的层实现
对于CosineFace、MobileFaceNet、ArcFace、Combined Margin loss这四种损失函数,都是为了提高人脸识别的分类效果,在原有softmax loss进行改进的。 在这几个改进之前,最早的是基于W-Norm的SphereFace(cosmθ),以及基于W-Norm和F-Norm的SphereFace(scosmθ),这里不对这两种做介绍,直接...
2018-12-24 14:48:05 7127 2
原创 基于Openpose框架的人脸关键点heatmaps预测模型设计、训练
众所周知,人脸识别中有一项重要的任务-人脸关键点预测,通过这个环节对齐,才能进行人脸识别,提高人脸识别的准确率。另外,一些活体检测/人脸状态分析也需要利用该方案进行实现。 经典的人脸检测模型MTCNN中具有人脸关键点的预测功能,但其关键预测精度比较差,对于大角度、模糊、遮挡、小尺度等情况的人脸效果下降更加严重。因此我结合openpose的关键点预测模型,自行设计了如下的人脸关键点...
2018-12-21 11:49:46 7053 5
原创 BiSeNet 语义分割网络结构详细解析
针对 BiSeNet: Bilateral Segmentation Network for Real-time Semantic Segmentation.该论文提出的语义分割网络,根据第三方实现提供的pytorch源码,进行了详细分析解读。论文中的网络框架如下图:源码中网络设计 对照上面的网络框架,下面的代码很好理解。其中在Context path部分,代码中使用的...
2018-12-21 10:40:02 5646 6
原创 FAN 人脸对齐网络结构详细解析
针对 How far are we from solving the 2D & 3D Face Alignment problem? (and a dataset of 230,000 3D facial landmarks)该论文提出的FAN网络,根据作者提供的pytorch源码,对FAN-2D网络,进行了详细分析解读。 下图为FAN-2D以及2D-to-3D模型的结构...
2018-12-20 14:59:36 4240 2
原创 BiSeNet训练笔记
BiSeNet训练总结笔记针对BiSeNet语义分割模型,利用开源的pytorch项目,进行了训练尝试。主要是利用不同的head network(res18和res101),结合不同的优化方法(rmsprop和sgd),在不同batch下(1,2,4,8)进行Camvid数据集的训练。训练结束以后,利用如下图片和真实标签进行测试和对比: 学习率poly更新策略其中初始...
2018-12-17 11:33:52 5450 4
原创 SSD框架详细解读(一)
目录模型结构Prior box默认框的产生Prior box 的大小尺寸计算输出层通道num_output计算。Priorbox的使用Permute,Flatten And Concat Layersmatching strategy:选择一系列default boxeshard negative miningdata augmentation技巧对比效果结...
2018-09-18 19:05:12 15853 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人