深度学习_王乐予的博客-CSDN博客

深度学习

关注

文章平均质量分 90

讲解深度学习的各板块知识

关注数：文章数：28 文章阅读量：181599 文章收藏量：1478

作者: 王乐予

这个作者很懒，什么都没留下…

展开

【深度学习实战—13】：基于MediaPipe的虹膜距离估计

人眼虹膜直径范围大概在11.7±0.5mm。因此我们可以利用相似三角形计算人眼与摄像头传感器的距离

原创 2024-10-25 11:08:46 · 824 阅读 · 0 评论
【深度学习实战—12】：基于MediaPipe的手势识别

本文将通过 Mediapipe 检测出手部关键点，并通过对各种关键点的位置判别，以达到手势识别的目的。

原创 2024-10-21 20:08:45 · 3833 阅读 · 0 评论
NCNN 记录2：NCNN 加载模型的三种方式（以 SqueezeNet 为例）

NCNN加载模型有三种方式，分别是： 1. 直接加载 param 和 bin（明文） 2. 加载二进制的 param.bin 和 bin 3. 从内存加载 param 和 bin

原创 2024-10-16 13:42:42 · 1907 阅读 · 0 评论
NCNN 记录1：Ubuntu+CLion+OpenCV+NCNN+Squeezenet 从源码编译到代码输出全流程记录

Ubuntu+CLion+OpenCV+NCNN+Squeezenet 从源码编译到代码输出全流程记录

原创 2024-10-15 17:04:43 · 1437 阅读 · 0 评论
【深度学习实战—11】：基于Pytorch实现谷歌QuickDraw数据集的下载、解析、格式转换、DDP分布式训练、测试

Quick Draw 数据集是 345 个类别的 5000 万张图纸的集合，由游戏 Quick， Draw！的玩家贡献。这些图画被捕获为带时间戳的矢量，并标记有元数据，包括要求玩家绘制的内容以及玩家所在的国家/地区。Github中提供了两种类型的数据集，分别是原始数据集和预处理后的数据集。本文将基于quickdraw数据集，对340个类别进行采用分布式训练进行迁移学习。

原创 2024-09-18 15:58:44 · 971 阅读 · 2 评论
【深度学习实战—10】：基于MediaPipe的坐姿检测

MediaPipe 是一款由 Google Research 开发并开源的多媒体机器学习模型应用框架。提供多种错误坐姿情况的判断。

原创 2024-05-29 17:00:56 · 5933 阅读 · 0 评论
【深度学习实战—9】：基于MediaPipe的人脸关键点检测

使用谷歌MediaPipe框架实现人脸关键点检测，获取人脸区域400多个3D关键点，并在图中标记出部分区域。

原创 2024-05-29 09:13:57 · 3867 阅读 · 3 评论
【深度学习实战—8】：基于MediaPipe的人脸检测

使用Google的MediaPipe方案进行人脸检测，提供视频流检测程序

原创 2024-05-27 11:29:04 · 943 阅读 · 0 评论
【深度学习实战—7】：基于Pytorch的多标签图像分类-Fashion-Product-Images

基于深度学习的多标签图像分类，使用时尚产品数据集。工程充分将代码解耦，便于代码管理。

原创 2024-05-25 18:24:17 · 3632 阅读 · 4 评论
【深度学习实战—6】：基于Pytorch的血细胞图像分类（通用型图像分类程序）

图像分类是搞深度学习一定要掌握的一个视觉任务，本文章将基于血细胞数据集实现图像分类！本文程序已解耦，可当做通用型图像分类框架使用。

原创 2023-09-10 14:26:22 · 4760 阅读 · 12 评论
【深度学习实战—5】：基于AlexNet的CIFAR10数据集分类（附Keras实现）

目录😺一、数据集获取😺二、定义AlexNet😺三、编译并训练😺四、测试模型😺五、预测结果可视化😺六、建立混淆矩阵😺附录：完整程序之前我们用AlexNet进行了手写数字的识别，今天带来对cifar10数据集的分类！文末附完整程序！😺一、数据集获取"""数据集获取"""def get_cifar10_d.

原创 2022-04-10 06:30:00 · 6349 阅读 · 2 评论
【深度学习实战—4】：基于AlexNet的手写数字识别（附Keras实现）

本节我们带来使用AlexNet经典网络进行手写数字识别！文末附完整程序！很多地方，如数据集获取，网络训练等都和【深度学习实战—3】：基于LetNet-5的手写数字识别（附Keras实现）差不多，有不同的就是网络的搭建，😺一、网络搭建因为论文中的alexnet的输入是（227, 227, 3），所以我们在搭建网络的时候，要将输入改为（28, 28, 1）。

原创 2022-04-09 06:30:00 · 8703 阅读 · 2 评论
【深度学习实战—3】：基于LetNet-5的手写数字识别（附Keras实现）

目录😺一、数据集获取😺二、定义LeNet-5😺三、编译并训练😺四、测试模型😺五、预测结果可视化😺六、建立混淆矩阵😺附录：完整程序当我们学习了LeNet-5网络和MNIST数据集之后，就要将经典网络用于实战中了！文末附完整程序！😺一、数据集获取"""数据集获取"""def get_mnist_dat.

原创 2022-03-27 06:00:00 · 12252 阅读 · 28 评论
【深度学习经典网络架构—10】：注意力模块之CBAM

一、简述在[【深度学习经典网络架构—8】：注意力机制之SE_Block](https://blog.csdn.net/qq_42856191/article/details/123655146?spm=1001.2014.3001.5501)中，我们介绍了CNN的通道注意力模块SE_Block，本次带来的是另一个即用即插的注意力模块CBAM。论文链接：[CBAM: Convolutional Block Attention Module](https://arxiv.org/pdf/1807.0652

原创 2022-03-26 07:30:00 · 6982 阅读 · 0 评论
【深度学习经典网络架构—9】：ShuffleNet系列（V1、V2）

一、简述在学术界，大多围绕着如何提高视觉任务的SOTA进行研究，但在工业界，一个良好的模型如何移植到计算能力不足的移动设备上才是重点考虑的问题。ShuffleNet是由旷视研究院于2018年发表在CVPR上的一篇文章。AI四小龙之一的旷视，多次在顶级会议（如CVPR、ECCV、ICCV）上发表文章。ShuffleNet的第一作者 Xiangyu Zhang 张祥雨也是里程碑式神经网络ResNet的作者！在ShuffleNet中，作者使用了两个操作，分别是==逐点组卷积（pointwise gro

原创 2022-03-25 07:30:00 · 7565 阅读 · 1 评论
【深度学习经典网络架构—8】：注意力机制之SE_Block

😺一、引言类似于人脑的注意力感知，那卷积神经网络能否也能产生注意力效果呢？答案是：**可以！****SE_Block是SENet的子结构**，作者将SE_Block用于ResNeXt中，并在ILSVRC 2017大赛中拿到了分类任务的第一名，在ImageNet数据集上将top-5 error降低到2.251%，比2016年的最好成绩提高了约25%。论文链接：[Squeeze-and-Excitation Networks](https://arxiv.org/abs/1709.01507)开源

原创 2022-03-24 08:23:11 · 23855 阅读 · 2 评论
【深度学习经典网络架构—７】：MobileNet系列（V1、V2、V3）

😺一、简述自从AlexNet赢得ImageNet挑战赛：ILSVRC 2012以来，卷积神经网络已成为计算机视觉中的普遍应用。总体趋势是制作更深、更复杂的网络，以实现更高的准确度。然而，这些提高准确性的进步并不一定会使网络在规模和速度方面更有效率。在机器人、汽车自动驾驶和增强现实等许多现实世界的应用中，识别任务需要在计算受限的平台上及时执行。谷歌提出MobileNet的目的就是**构造一个可以在移动端和嵌入式端应用深度学习的网络，使得在CPU上也能达到理想的速度要求。**MobileNet V1

原创 2022-03-23 07:30:00 · 5712 阅读 · 0 评论
【深度学习实战—番外篇2】：如何保存CIFAR-10数据集图片？

一、简述CIFAR-10数据集是一个包含了60000张32×32的RGB图像数据集，所有图像共被划分为10个类别，分别为：['飞机', '汽车', '鸟', '猫', '鹿', '狗', '青蛙', '马', '船', '卡车']['airplane', 'automobile', 'bird', 'cat', 'deer', 'dog', 'frog', 'horse', 'ship', 'truck']【深度学习实战—2】：基于Keras的cifar10图像分类（非常详细、代码开源）这篇博文已

原创 2022-03-21 12:23:09 · 4768 阅读 · 0 评论
【深度学习经典网络架构—6】：DenseNet

CNN作为计算机视觉领域的主流方法，已经诞生了诸多优秀模型（AlexNet、VGG、GoogLeNet、ResNet等），每个模型的优点之前都有介绍。DenseNet的作者是Zhuang Liu（清华大学）、Gao Huang和Kilian Q.Weinberger（康奈尔大学）、Laurens van der Maaten（脸书研究员），论文斩获CVPR 2017最佳论文！论文链接：Densely Connected Convolutional Networks作者借鉴了ResNet思想，但

原创 2022-01-10 21:37:36 · 4806 阅读 · 0 评论
【深度学习经典网络架构—5】：ResNet

残差网络创作于2015年，作者是时任微软研究院的四名研究员Kaiming He 何恺明、Xiangyu Zhang 张祥雨、Shaoqing Ren 任少卿、Jian Sun 孙剑！这四位都是AI领域响当当的人物，论文一作[何恺明](http://kaiminghe.com/)可是妥妥的大神，多次在计算机视觉领域的三大顶会（CVPR、ICCV、ECCV）中夺得最佳论文奖、最佳学生论文奖以及多次Best Paper提名，此外，谷歌在2020年发布的学术指标榜单中，CVPR 2015-2019

原创 2022-01-09 22:52:26 · 3998 阅读 · 0 评论
【深度学习经典网络架构—4】：GoogLeNet（Incepetion系列V1、V2、V3）

之前我们说VGG拿到了ImageNet挑战赛（ILSVRC2014）分类项目的亚军，冠军就是谷歌提出的GoogLeNet，而**Inception模型是GoogLeNet的核心**。要想提高网络性能，常用方法就是提高神经网络的深度与宽度，但这也会带来两个问题

原创 2022-01-09 15:08:31 · 6318 阅读 · 2 评论
【深度学习实战—番外篇1】：如何保存MNIST数据集图片？

目录一、数据集介绍一、数据集介绍MNIST数据集是计算机视觉领域的一个入门级数据集！【深度学习实战—1】：基于Keras的手写数字识别这篇博文已经介绍了如何使用MNIST数据集并基于keras框架做了一个分类任务！该篇博文讲详细的介绍如何使用MNIST数据集及其他处理过程。???

原创 2022-01-06 22:41:35 · 3707 阅读 · 0 评论
【深度学习经典网络架构—3】：VGG（附Keras实现）

目录一、网络简介二、网络结构2.1 网络配置2.2 网络立体图结构2.3 网络平面图结构三、网络特点四、Keras实现4.1 程序编写4.2 打印模型信息五、总结一、网络简介VGG网络是由牛津大学计算机视觉组和谷歌DeepMind公司共同设计的。VGG网络并且在2014年在ILSVRC大赛上获得了定位项目的第一名和分类项目的第二名。作者通过VGG论证了一个非常重要的结论：CNN的深度与小卷积核的使用对图像识别与分类有很大影响！论文链接：Very Deep Convolutional Network

原创 2021-12-16 19:58:00 · 5290 阅读 · 0 评论
【深度学习经典网络架构—2】：AlexNet（附Keras实现）

目录一、网络简介二、网络创新点三、网络结构3.1 网络立体图结构3.2 网络平面图结构一、网络简介我们知道LeNet是第一个经典的卷积神经网络，但第一个走进大家视线的是AlexNet！AlexNet是由Alex Krizhevsky、Ilya Sutskever和Geoffrey E. Hinton三人提出的，文章发表于2012年，AlexNet网络拿到了ImageNet LSVRC-2010比赛的冠军（ImageNet LSVRC-2010比赛要求参赛者在具有1.2 million的高分辨率图像数据

原创 2021-12-16 09:55:42 · 7135 阅读 · 2 评论
【深度学习经典网络架构—1】：LeNet（附Keras实现）

目录一、网络简介二、网络结构2.1 INPUT层（输入层）2.2 C1层（卷积层）一、网络简介LeNet是一个用于手写体字符识别非常高效的网络！作者Yan LeCun于1998年提出该网络，也是后续各大神经网络的伊始！论文链接：Gradient-based learning applied to document recognition二、网络结构图像经过LeNet的处理过程如下：LeNet共有7层（不包括输入层）：卷积层—池化层—卷积层—池化层—卷积层—全连接层—全连接层别看LeNet

原创 2021-12-15 10:15:53 · 6804 阅读 · 0 评论
【深度学习实战—2】：基于Keras的cifar10图像分类（非常详细、代码开源）

深度学习的”hello world“（【深度学习实战1】：基于Keras的手写数字识别（非常详细、代码开源））已经更新完了，会了手写数字识别就说明一只脚已经踏进了深度学习的大门！今天博主带来第二个实战内容：基于Keras的cifar10图像分类。全是干货，文末附完整代码！一、准备工作设备\库型号\版本显卡GTX1650驱动程序版本457.49tensorflow-gpu版本2.4.0keras版本2.4.3Python版本3.7.3二

原创 2021-11-29 09:31:16 · 12109 阅读 · 7 评论
【深度学习实战—1】：基于Keras的手写数字识别（非常详细、代码开源）

本来想着多更新一些关于深度学习的文章，但这方面知识专业度很高，如果作者本身都掌握不好，又怎么能写出好文章分享呢？距离第一篇关于深度学习的文章：深度学习笔记1——激活函数，已经过去了9个多月，在沉淀了9个月后，这次写出了第二篇关于深度学习的文章，而且出于快速上手代码编写的目的，这次直接进行手写数字识别的实战，且看下文：一、准备工作设备\库型号\版本显卡GTX1650驱动程序版本457.49tensorflow-gpu版本2.4.0keras版本2.4

原创 2021-11-19 16:16:58 · 19718 阅读 · 23 评论
【深度学习笔记—1】：激活函数

想必对于深度学习或多或少学过的童鞋们一定知道激活函数，本文就详细介绍以下为什么深度学习模型需要激活函数，激活函数的种类都有哪些，我们又该如何正确选择激活函数。∗∗本文很重要∗∗**本文很重要**∗∗本文很重要∗∗...

原创 2021-02-17 10:45:16 · 7474 阅读 · 1 评论

深度学习

作者: 王乐予

【深度学习实战—13】：基于MediaPipe的虹膜距离估计

【深度学习实战—12】：基于MediaPipe的手势识别

NCNN 记录2：NCNN 加载模型的三种方式（以 SqueezeNet 为例）

NCNN 记录1：Ubuntu+CLion+OpenCV+NCNN+Squeezenet 从源码编译到代码输出全流程记录

【深度学习实战—11】：基于Pytorch实现谷歌QuickDraw数据集的下载、解析、格式转换、DDP分布式训练、测试

【深度学习实战—10】：基于MediaPipe的坐姿检测

【深度学习实战—9】：基于MediaPipe的人脸关键点检测

【深度学习实战—8】：基于MediaPipe的人脸检测

【深度学习实战—7】：基于Pytorch的多标签图像分类-Fashion-Product-Images

【深度学习实战—6】：基于Pytorch的血细胞图像分类（通用型图像分类程序）

【深度学习实战—5】：基于AlexNet的CIFAR10数据集分类（附Keras实现）

【深度学习实战—4】：基于AlexNet的手写数字识别（附Keras实现）

【深度学习实战—3】：基于LetNet-5的手写数字识别（附Keras实现）

【深度学习经典网络架构—10】：注意力模块之CBAM

【深度学习经典网络架构—9】：ShuffleNet系列（V1、V2）

【深度学习经典网络架构—8】：注意力机制之SE_Block

【深度学习经典网络架构—７】：MobileNet系列（V1、V2、V3）

【深度学习实战—番外篇2】：如何保存CIFAR-10数据集图片？

【深度学习经典网络架构—6】：DenseNet

【深度学习经典网络架构—5】：ResNet

【深度学习经典网络架构—4】：GoogLeNet（Incepetion系列V1、V2、V3）

【深度学习实战—番外篇1】：如何保存MNIST数据集图片？

【深度学习经典网络架构—3】：VGG（附Keras实现）

【深度学习经典网络架构—2】：AlexNet（附Keras实现）

【深度学习经典网络架构—1】：LeNet（附Keras实现）

【深度学习实战—2】：基于Keras的cifar10图像分类（非常详细、代码开源）

【深度学习实战—1】：基于Keras的手写数字识别（非常详细、代码开源）

【深度学习笔记—1】：激活函数