3.1交叉熵代价函数
3.1.1 引入交叉熵代价函数
![在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/7c148fdba1a9b90eba1372bb27baf4d5.png)
3.1.2使用交叉熵来对MNIST数字进行分类
3.1.3交叉熵的含义?源自哪里?
3.1.4 柔性最大值(Softmax)
3.2过度拟合和规范化
3.2.1 规范化
L2规范化(权重衰减weight decay)
3.2.2为何规范化可以帮助减轻过度拟合
3.2.3 规范化的其他技术
L1规范化
弃权(Dropout)
人为扩展训练数据
3.3权重初始化
3.5如何选择神经网络的超参数
宽泛策略
学习速率
小批量数据大小
自动技术
3.6其他技术