yuanlulu的博客 深度学习开发者

从事深度学习和机器视觉方向的开发。个人擅长c++/python语言。

这就是神经网络 19:深度学习-人脸检测-S3FD

概述 本文介绍1篇人脸检测方面的工作,这是2017年的工作。S3FD是SSD类的检测器,为人脸检测做了相应优化和修改。即使放在今年(2019),这个工作的结果也都是SOTA级的存在。 前段时间写了文章总结FaceBoxes,那篇文章和本文的主角S3FD是同一个实验室出品的,都来自中国,并且在榜单中...

2019-06-24 18:21:10

阅读数 25

评论数 0

深度学习-文档检测方案整理

概述 这里梳理一下之前收集的几篇关于文档检测的文章,由于一些特殊的原因,最近可能都没机会去实践这些知识了,只能略读归纳一下。 在识别纸质文档的第一步,一般首先要识别文档区域,也就是定位出文档4个角的坐标,然后拉伸文档区域,还原宽高比,接着后续的OCR流程。本文主要记录一些文档区域检测方面的文章。 ...

2019-06-20 16:40:25

阅读数 34

评论数 0

视频安防“上帝视角“的畅想

畅想 目前的视频安防手段主要还是记录不同角度的二维画面,实时(比如闯红灯抓拍)或事后分析处理。由于安防摄像头数量众多,安装角度和安装地点分散,很难对存量的巨大数量的视频录像做有效分析。目前很多安防视频平台正在利用深度学习的能力不断增强对视频解读的能力,但是效果基本就是类似去数据库里查某些字段,对普...

2019-06-17 22:40:25

阅读数 133

评论数 1

docker常用命令

概述 在我的深度学习开发相关工作中,使用docker非常多。有cpu版本的docker也有GPU版本的docker。我可以把很多依赖的软件打包到docker里交给现场运行,这样现场就免去了繁杂的环境配置过程。 在此记录一下常用的docker命令。 搜索和下载镜像 去年阿里有一个可以搜索docker...

2019-06-11 19:52:10

阅读数 61

评论数 0

这就是神经网络 18:深度学习-文字识别OCR-CRNN

概述 在之前项目中用过CRNN做OCR,我在这里记录一下我对这个算法的理解,我没有对比代码去看,主要结合别人的博客略读论文。 声明一下,主要参考了文末的《一文读懂CRNN+CTC文字识别》这篇文章,基本讲的非常易懂。另外,本算法的难点在于CTC的理解, 基本上参考文末的《Sequence Mode...

2019-05-15 21:34:42

阅读数 104

评论数 0

项目实践中对语义分割网络DeepLabV3+的改进

概述 最近用deepv3+做了一些语义分割的工作,从github上下载了别人实现的tensorflow实现。发现速度不能满足需求,所以本人对deepv3+做了一些改进。 原始的网络结构 下图左侧是DeepLabV3的结构,中间是U-Net风格的编解码结构,最右侧就是DeepLabV3+的结构。和V...

2019-05-15 21:20:32

阅读数 67

评论数 1

基于语义分割的身份证部件解析和文字检测

概述 这个工作主要是利用人脸解析项目的算法,探索一下语义分割的功能。安排实习生利用合成的身份证照片进行了语义分割的标注。 我的目的有两个:1.检测身份证上的信息是否齐全;2.确定身份证各文字信息的位置,把文字抠出来给OCR程序。 基于opencv的算法 之前写过一篇文章《python_opencv...

2019-05-10 18:09:42

阅读数 134

评论数 6

tensorflow 23:从ckpt文件导出固化PB文件

概述 需要从ckpt文件生成固化的PB文件,给生成现场用。现在我探索下不依赖代码里的网络结构、仅仅用CKPT文件来生成PB文件。 转化 训练生成的ckpt文件目录如下: $ ls ./ckpt0507/ checkpoint graph.pbtx...

2019-05-09 20:02:15

阅读数 102

评论数 0

这就是神经网络 17:深度学习-评价指标_ROC_mAP

概述 本文主要讲述目标检测指标mAP。主要也是自己做这块有段时间,但是这个指标一直没弄的特别清楚。而且网上很多博客写的并不准确,会给人不少舞蹈,希望自己的文章能帮到别人。 基础知识 true positive, false positive, true negative, false negati...

2019-05-08 20:45:46

阅读数 150

评论数 0

自制人脸分割/解析数据集:helen_small4seg(附网盘下载地址)

概述 我用原始的helen数据,挑选了部分标注比较好的图片,生成了一个规模较小的人脸解析/分割数据集,放在网盘上供大家下载。 原始helen数据集介绍 关于helen数据集的介绍,请参考我之前的博客:《人脸解析(Face Parsing)和人体解析Human Parsing:方法、数据集和论文》。...

2019-05-03 17:58:16

阅读数 132

评论数 7

目标检测中的检测框合并策略:NMS和Soft-NMS

概述 目标检测中的Region Proposal动辄上千,会形成大量有重合的检测框,需要使用某些算法对检测框去重。 常用的两种算法是NMS和Soft-NMS。 NMS 全称‘非极大值抑制(non maximum suppression)’. 算法思想很简单,按照分类概率排序,概率最高的框作为候选框...

2019-05-02 17:00:40

阅读数 221

评论数 0

这就是神经网络 16:深度学习-人脸检测-FaceBoxes

概述 FaceBoxes是SSD类的检测器,为人脸检测做了相应优化和修改。即使放在今年(2019)也是SOTA级的存在。 (本来打算把SSH、S3FD也一起总结了,但是最近时间比较紧张,先放FaceBoxes,另外两个后续再补) 借用《人脸检测背景介绍和发展现状》里的一张图: FaceBoxes...

2019-05-01 18:58:06

阅读数 166

评论数 0

仿射变换与投影变换

仿射变换在图形中的变换包括:平移、缩放、旋转、斜切及它们的组合形式。这些变换的特点是:平行关系和线段的长度比例保持不变。 投影变化具有其明确的意义:共面点成像。 参考资料 仿射变换与投影变换 ...

2019-04-29 18:52:28

阅读数 81

评论数 0

怎样用通俗的语言解释REST,以及RESTful?

@Ivony 老师的一句话概括很精辟: URL定位资源,用HTTP动词(GET,POST,DELETE,DETC)描述操作。 参考资料 知乎:怎样用通俗的语言解释REST,以及RESTful? 菜鸟教程:RESTful 架构详解 ...

2019-04-28 15:06:58

阅读数 41

评论数 0

python之web server搭建:Gunicorn、flask及tornado

利用Gunicorn和flask搭建web-server 之前用tornado搭服务器,但是tornado只支持多线程。众所周知python的多线程性能是很差的。 要上多进程,Gunicorn加flask这个组合刚好满足需求。而且Gunicorn支持进程意外退出后重启,还支持很多灵活的配置,综合来...

2019-04-26 22:13:12

阅读数 75

评论数 0

这就是神经网络 15:深度学习-人脸检测-MTCNN

概述 MTCNN是一个基于级联卷积神经网络的人脸检测和人脸对齐算法。其英文题目《Joint Face Detection and Alignment using Multi-task Cascaded Convolutional Networks》。 本文原始的创意来自《A Convolution...

2019-04-21 18:47:32

阅读数 107

评论数 0

tensorflow 22:量化模型在pc环境调用

概述 之前写过一文探讨tflite模型在pc环境下的调用: 《tensorflow 21:用python转换tflite模型并在PC上调用》 我就想,能不能只量化,格式还是普通的pb格式,然后在pc环境调用。这样既享受了量化压缩带来的好处,又不受制于tflite支持的算子不全面。 结论 没啥用! ...

2019-04-19 16:14:48

阅读数 84

评论数 0

这就是神经网络 14:深度学习-目标检测-YOLOv1、YOLOv2、YOLOv3

YOLO YOLO是与SSD齐名的one_stage目标检测算法代表。SSD系列有比较多的变体,大部分都不是SSD作者做的工作。而YOLO目前已经进化到V3,据我所知都是yolo作者自己做的工作。 网络结构 由于yolo属于one_stage的目标检测算法,所以网络结构比较简单。固定输入448x4...

2019-04-15 20:21:28

阅读数 197

评论数 0

这就是神经网络 13:语义分割loss函数和评价指标

序 最近刚刚完成自己规划的语义分割部分论文阅读,算是一个小结吧。 语义分割的LOSS函数 语义分割对像素的分类,可以用交叉熵作为loss函数。 但是语义分割也有自己的特殊性,整个环面中前景物体有时会有较小的占比(比如医学图像中的病灶),这时需要加大前景(或缝隙)的权重,使训练过程更容易学到有用的特...

2019-04-02 21:04:27

阅读数 236

评论数 0

这就是神经网络 12:深度学习-语义分割-DeepLabV1、V2、V3和V3+

概述 说到语义分割,谷歌的DeepLab系列都是一个无法绕过的话题。目前这个系列共出了4个版本:V1、V2、V3和V3+。DeepLab是全景分割,也有DeeperLab原班人马在里面参与。 本文主要关注DeepLabV3+和DeepLab。V1、V2作为前作,有一定的参考价值,但是我精力有限,这...

2019-03-31 16:31:20

阅读数 354

评论数 0

提示
确定要删除当前文章?
取消 删除
关闭
关闭