计算机视觉开源工具中的瑞士军刀—Dlib最新高级特性教程

(欢迎关注“我爱计算机视觉”公众号,一个有价值有深度的公众号~)

OpenCV是计算机视觉开源工具中妇孺皆知的,但Dlib绝对是这几年快速上升的一颗新星,它并不追求大而全,但它实现的每一个模块和特性,都几乎是高质量开源算法的典范。

在刚刚结束的PyImageConf2018会议上,大名鼎鼎的Dlib库的创建者Davis King做了一个关于目标检测的报告,并举办了关于Dlib的含有40个新的开源Demo的各种计算机视觉与机器学习技术演示的WorkShop。展示了Dlib的强大锐利,是学习Dlib使用的绝佳资料,作者已将相关PPT、代码、数据开源,非常值得推荐!

Davis King本尊一直供职于工业界,热衷开源技术分享,最近今年尤其关注于计算机视觉与深度学习工具的构建,Dlib库中无论是其传统的HOG+SVM目标检测、高精度超快速广泛使用的人脸对齐,还是基于CNN的目标检测与人脸验证,Dlib每一次新特性和Demo的添加,几乎都是将学术界state-of-the-art技术实用化,令人印象深刻!

这次题为《Finding things in images How does that work? 》的目标检测报告,作者从滑动窗口讲到HOG检测器及其优化,并介绍了Dlib中基于图像金字塔的CNN目标检测,其速度很快且相比于SSD算法其对小目标检测性能更好,并分享了影响目标检测性能的一些因素,比如训练数据数量和质量及超参数的优化等,详细内容可在文末下载PPT查看。

在关于Dlib使用的WorkShop中,Davis King通过40个新的Python例子代码展示了Dlib解决目标检测问题从数据标注到训练模型到参数优化的方方面面,你会发现原来Python-Dlib这么简单(是的,有些功能只需要几行代码!),作者同时展示了Dlib中其他一些有趣功能和实践示例,每份代码都值得细读并在你的机器上跑一遍。

下面是这40个例子的主要功能:

001——训练HOG检测器;

002——运行HOG检测器;

003——为人脸特征点检测制作人脸图像数据和XML文件;

004——训练人脸特征点检测模型;

005——运行人脸特征点检测模型;

006——匈牙利算法;

007——8像素步长的HOG检测;

008——制作包围盒回归训练数据集;

009——训练目标检测中包围盒回归模型;

010——检测人脸并进行精确的包围盒回归定位;

011——全局最优化方法(这是Davis King强烈安利的新特性!);

012——训练包围盒回归模型并进行超参数搜索;

013——在视频中检测人脸并进行包围盒回归位置提精和卡尔曼滤波;

014——可分离滤波器;

015——训练nuclear normHOG检测器;

016——运行nuclear normHOG检测器;

017——训练多个HOG检测器;

018——运行多个HOG检测器;

019——训练多个HOG检测器并进行超参数优化;

020——图像哈希;

021-023——使用联通域分析进行斑点检测,并进行速度优化;

024——边缘检测并找直线;

025-026——通过梯度计算亮斑;

027——霍夫变换;

028-034——通过霍夫变换定位图像中的纸张;

035——通过mbd方法定位视频中旋转的指尖陀螺;

036——通过MSER进行文本检测;

037——训练RBF核的SVM的二类问题,自动优化最优参数(Dlib中的AutoML);

038——求和运算的缓存SIMD优化;

039——多线程数据加载;

040——使用CUDA进行矩阵运算加速。

Github地址:

https://github.com/davisking/pyimageconf2018

我爱计算机视觉公众号对话界面回复py2018,即可收到PPT、数据和代码的百度云下载地址。

更多精彩推荐:

OpenCV深度学习文本检测示例程序(EAST text detector)

基于OpenCV与Dlib的行人计数开源实现

OpenCV开发团队开源计算机视觉标注工具CVAT

(欢迎关注“我爱计算机视觉”公众号,一个有价值有深度的公众号~)

【本文由“我爱计算机视觉”发布,2018年08月31日】

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
├─1.计算机视觉简介、环境准备(python, ipython) │ computer vsion.pdf │ CS231 introduction.pdf │ ├─2.图像分类问题简介、kNN分类器、线性分类器、模型选择 │ 2. 图像分类简介、kNN与线性分类器、模型选择.mp4 │ 2.初识图像分类.pdf │ ├─3.再谈线性分类器 │ 3.再谈线性分类器.mp4 │ 再谈线性分类器.pdf │ ├─4.反向传播算法和神经网络简介 │ .反向传播算法和神经网络简介.pdf │ 4. 反向传播算法和神经网络简介.mp4 │ ├─5.神经网络训练1 │ 5.-神经网络训练1.pdf │ 5.神经网络训练1.mp4 │ ├─6.神经网络训练2、卷积神经网络简介 │ 6.神经网络训练2.mp4 │ 神经网络训练2.pdf │ ├─7.卷积神经网络 │ 7.卷积神经网络.mp4 │ Lession7.pdf │ ├─8.图像OCR技术的回顾、进展及应用前景 │ 8.图像OCR技术的回顾、进展及应用前景.mp4 │ PhotoOCR_xbai.pdf │ └─9.物体定位检测 物体定位检测.pdf │ ├─10.卷积神经网络可视化 │ .卷积神经网络可视化.pdf │ 10.卷积神经网络可视化.mp4 │ ├─11.循环神经网络及其应用 │ 11.循环神经网络及其应用.mp4 │ 循环神经网络.pdf │ ├─12.卷积神经网络实战 │ 12.卷积神经网络训练实战.mp4 │ 卷积神经网络实战.pdf │ ├─13.常见深度学习框架介绍 │ 常见深度学习框架介绍.pdf │ ├─14.图像切割 │ 14.图像切割.mp4
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值