人脸识别美颜算法实战-深度学习基础知识

最新推荐文章于 2025-03-21 14:20:27 发布

一壶浊酒..

最新推荐文章于 2025-03-21 14:20:27 发布

阅读量996

点赞数 1

文章标签：深度学习算法人工智能

本文链接：https://blog.csdn.net/qq_40107571/article/details/128555849

版权

读书笔记专栏收录该内容

28 篇文章

订阅专栏

深度学习与机器学习的区别在于自动特征提取。深度学习利用多层神经网络，底层提取低维度特征，高层处理高维度特征。关键概念包括神经网络、权重、偏差、激活函数（如Sigmoid、ReLU、tanh和Softmax）、批量归一化、丢弃法。卷积神经网络用于图像特征提取，池化层减少参数，全连接层用于分类。循环神经网络适用于顺序数据。人脸识别涉及人脸检测、对齐、特征提取和匹配，常用MTCNN和Arcface。数据增强和梯度问题（消失和激增）是训练中的考虑因素。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

深度学习与机器学习的区别：

机器学习：人类定义输入数据的特征

深度学习：机器自动找到输入数据的特征

在深度学习中，采用多层的神经网络架构来提取图像信息，越靠近底层的神经网络提取出来的都是点、线等低维度特征，而高维度的神经网络层则会更多地保留比如耳朵、眼睛等高维度特征

深度学习通过低维度特征到高维度特征一层层地构建，找到最终能够构成分类器的最佳组合。

深度学习入门概念

1．神经网络

在深度学习中，神经网络由很多“神经元”组合而成，神经元的作用是传递数据，通过训练调整相关的权重，完成深度学习中的“学习”功能。神经网络是一切深度学习网络的基石。

2 偏差

权重只改变输入比例的大小，添加另外一个线性变量——偏差（bias），输入就变成了：

权重×输入+偏差

添加偏差的目的是为了扩展权重与输入相乘所得结果的范围。

3 激活函数

输入通过增加权重和偏差后，输入的形式为y=ΣW×X+b，将这个线性分量应用于输入时需要将这个线性输入变成一个非线性输入，使得神经网络可以解决更多复杂的问题

常见的激活函数有Sigmoid、ReLU、tanh和Softmax。

（1）Sigmoid定义如下：

Sigmoid(x)=1/(1+exp(-x))

优点：Sigmoid函数求导容易，其输出映射在（0,1）之间，单调且连续，输出范围有限、稳定，可以用作输出层。缺点：由于其具有软饱和性，容易产生梯度消失，从而导致训练出现问题。

（2）ReLU激活函数经常被用来处理隐藏层，其函数定义为：

f(x)=max(x,0)

ReLU激活函数的优点：对于大于0的所有输入而言，它都有一个不变的导数值。在网络训练中，常数导数值有助于增加训练速度，所以 ReLU激活函数经常用于隐藏层。

（3）tanh激活函数被定义为：

tanh(x)=(1-exp(-2x))/(1+exp(-2x))

tanh激活函数的优点：比Sigmoid函数收敛速度更快。

tanh激活函数的缺点：无法解决由于饱和性产生的梯度消失。

4 Softmax激活函数通常用于输出层，用于解决多分类问题。它与Sigmoid函数很相似，但是后者通常应用于解决二分类问题。

4 批量归一化

神经网络在训练时，其权重在梯度下降的每个步骤之后都会改变，这会改变数据的形状，因此需要在将数据发送到下一层之前明确规范化数据，以确保数据的分布与下一层希望获得的数据分布相同。这个批量规范化数据的过程就叫批量归一化

5 丢弃

丢弃（dropout）是一种正则化方法，作用是防止网络过度拟合。具体思路：在训练期间，隐藏层中一定数量的神经元被随机地丢弃.

卷积神经网络

深度学习是一个框架，包含了很多重要的算法，主要有 Convolutional Neural Networks（CNN，卷积神经网络）、Auto Encoder（自动编码器）、Sparse Coding（稀疏编码）、Restricted Boltzmann Machine（RBM，限制波尔兹曼机）、Deep Belief Networks（DBN，深信度网络）、Recurrent Neural Network（RNN，多层反馈循环神经网络）。