rainforestgreen-CSDN博客

原创 Caffe 数据增强源码解读--数据层与data_transformer

深度学习训练中数据是基础，为了让模型的训练效果更好，泛化性能更强，数据增强是一种广泛采用的技巧。但是caffe官方的实现的一些数据输入层比如DataLayer、ImageDataLayer层所支持的数据增强操作实在比较有限，因此这里解读一下caffe中数据增强部分的代码，并分析如何修改源码增加数据增强的功能（主要是指明修改思路）一、数据层相关的类图关系 Ca...

2019-01-24 14:00:56 1207

原创人脸特征提取模型（细致分析对比分析）-基于LFW数据集

动机总所周知，LFW数据在人脸特征提取模型的验证上是一个基本的标杆，目前大部分的方法在上面的效果已经都超过了99%的验证准确度，但是单纯的测试模型在上面的准确度，并不能分析出模型的性能到底好多少？到底好在什么方面？（因为大部分模型的验证精度都差别很小了）。出于以上原因，为了对比不同模型具体性能的差异，设计了如下分析方案： ...

2019-01-12 14:08:28 7844 3

原创 FAN 训练复现（独立实现数据准备与训练部分的代码）

由于原作者的FAN-2D模型中，是基于一个头网络+4个Hourglass模块，在Titan X上需要43-50ms的处理时间。为了提高一些模型速度，这里尝试重新压缩简化一下模型，只采用2个Hourglass模块。由于作者并未开放pytorch版的训练源码，因此根据自己的理解重新实现训练代码，并进行训练验证。数据集准备计划使用300W-LP数据集。并根据数据集生...

2019-01-04 17:12:24 1050 3

原创 FAN 2D/3D人脸关键点预测论文解读

论文全称为： How far are we from solving the 2D & 3D Face Alignment problem? (and a dataset of 230,000 3D facial landmarks)简介 ICCV 2017的论文，结合最先进的人脸特征点定位（landmark localization）架构和最先进的残差模块（residu...

2018-12-25 13:44:07 4534

原创 Combined Margin loss人脸识别训练笔记

利用caffe第三方实现的combined margin_layer进行训练（https://github.com/gehaocool/CombinedMargin-caffe），数据集采用VGGFace2，经过筛选以后共有8631个人的244W+的人脸图片。训练过程中出现了一下问题，这里进行记录。一、利用开源项目中的res36-E网络进行训练训练过程比较顺利，...

2018-12-25 09:50:21 2678

原创（Caffe人脸识别）CosineFace、ArcFace、MobileFaceNet、Combined Margin loss的原理以及在caffe中的层实现

对于CosineFace、MobileFaceNet、ArcFace、Combined Margin loss这四种损失函数，都是为了提高人脸识别的分类效果，在原有softmax loss进行改进的。在这几个改进之前，最早的是基于W-Norm的SphereFace（cosmθ），以及基于W-Norm和F-Norm的SphereFace（scosmθ），这里不对这两种做介绍，直接...

2018-12-24 14:48:05 7416 2

原创基于Openpose框架的人脸关键点heatmaps预测模型设计、训练

众所周知，人脸识别中有一项重要的任务-人脸关键点预测，通过这个环节对齐，才能进行人脸识别，提高人脸识别的准确率。另外，一些活体检测/人脸状态分析也需要利用该方案进行实现。经典的人脸检测模型MTCNN中具有人脸关键点的预测功能，但其关键预测精度比较差，对于大角度、模糊、遮挡、小尺度等情况的人脸效果下降更加严重。因此我结合openpose的关键点预测模型，自行设计了如下的人脸关键点...

2018-12-21 11:49:46 7293 5

原创 BiSeNet 语义分割网络结构详细解析

针对 BiSeNet: Bilateral Segmentation Network for Real-time Semantic Segmentation.该论文提出的语义分割网络，根据第三方实现提供的pytorch源码，进行了详细分析解读。论文中的网络框架如下图：源码中网络设计对照上面的网络框架，下面的代码很好理解。其中在Context path部分，代码中使用的...

2018-12-21 10:40:02 5964 6

原创 FAN 人脸对齐网络结构详细解析

针对 How far are we from solving the 2D & 3D Face Alignment problem? (and a dataset of 230,000 3D facial landmarks)该论文提出的FAN网络，根据作者提供的pytorch源码，对FAN-2D网络，进行了详细分析解读。下图为FAN-2D以及2D-to-3D模型的结构...

2018-12-20 14:59:36 4618 2

原创 BiSeNet训练笔记

BiSeNet训练总结笔记针对BiSeNet语义分割模型，利用开源的pytorch项目，进行了训练尝试。主要是利用不同的head network（res18和res101），结合不同的优化方法（rmsprop和sgd），在不同batch下（1,2,4,8）进行Camvid数据集的训练。训练结束以后，利用如下图片和真实标签进行测试和对比：学习率poly更新策略其中初始...

2018-12-17 11:33:52 5593 4

原创 SSD框架详细解读（一）

目录模型结构Prior box默认框的产生Prior box 的大小尺寸计算输出层通道num_output计算。Priorbox的使用Permute，Flatten And Concat Layersmatching strategy：选择一系列default boxeshard negative miningdata augmentation技巧对比效果结...

2018-09-18 19:05:12 16147 1

rainforestgreen的博客