一、起源
二、目标
三、核心知识点
四、深度学习模型解决问题的一般步骤
五、深度学习模型的应用
六、深度学习的发展脉络
一. 起源**
源于对大脑对事物的认知,本质是高层的特征是低层特征的组合,从低层到高层的特征表达越来越抽象和概念化。
二. 目标
深度学习的目标就是为了解决非线性问题。
它是一个端到端的解决方案,类似于一个黑盒子。
与传统算法不同,它在提取特征时,可以自动提取,不需要人为设计。
三. 核心知识点
- 单层感知机
只适用于线性可分问题,不能解决异或问题。 - 激活函数(非线性),多层感知机
通过增加神经网络的层数,添加激活函数可以使得神经网络具备解决非线性问题,目前主流的激活函数是relu函数。
早期的神经网络大多使用sigmoid激活函数,虽然它具有很好的效果,但是,随着层数的增加,这种函数很容易出现衰减。
Relu函数的提出,能够解决梯度消失的问题,为神经网络增加深度。
缺点:在函数为0时,不可微。
3.损失函数
损失函数表征模型预测分布和样本真实分布的差异,一般通过交叉熵来表示,也可以依据实际场景自定义损失函数。
4.正则项
损失函数中添加正则