深度学习
深度学习的目的
寻找一个合适的函数,能够准确地预测出类别。
进一步解释为,从候选的函数集合中找一个最好的函数
学习过程:
具体细节:
1.建立模型(人来确定函数集合)
定义:确定复杂函数的基本形态,但还不确定它的具体参数,也就是确定了一个函数集合。
神经元(一种简单的线性函数)
通过将上述简单神经元组合成复杂的神经网络(复杂的函数)
网络结构
单纯的线性叠加,还是一个简单的线性函数,不会变成更复杂的函数,所以引入了激活函数。
激活函数
作用:把线性函数变成非线性函数
常用激活函数列表:
前馈神经网络
例子
输出层
归一化处理,便于计算,常用softmax函数做输出层的激活函数
设置合适的网络结构
人为确定层数和节点个数,激活函数
2.损失函数(人来确定好坏的评判标准)
损失:标签与预测之间的误差
目的:找一组参数使总损失越小越好
-选择常用损失函数,平方误差,交叉熵。。。
3.参数学习(机器找到最好的函数)
梯度下降
根据步长进行调整
可能停在局部最优值
二维可视化
反向传播算法
链式求导
反向更新w,直至梯度值变为最小。
链式法则
正向传播