深度学习基础总结，无一句废话（附完整思维导图）

最新推荐文章于 2022-09-22 15:04:13 发布

算法channel

最新推荐文章于 2022-09-22 15:04:13 发布

阅读量736

点赞数 1

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xo3ylAF9kGs/article/details/106088435

版权

本文总结了深度学习的基础知识，包括线型回归、softmax 回归、多层神经网络及其相关概念。讨论了模型训练、损失函数、优化算法、模型选择和过拟合解决方案，提供了重要的技巧和建议。

摘要由CSDN通过智能技术生成

1 线型回归

预测气温、预测销售额、预测商品价格等

模型：权重，偏差

模型训练：feed 数据学习模型参数值，使得误差尽可能小

训练集、测试集、验证集、样本、标签、特征

损失函数：回归常用平方误差函数；

优化算法：小批量随机梯度下降（每次选一小批样本训练参数），每批样本大小叫做 batch size

学习率：正数

超参数：不是通过训练学出的，如学习率，批量大小

网络输出层只有一个神经元节点

全连接层：输出层中的神经元和输入层中各个输入完全连接

基本要素：模型、训练数据、损失函数和优化算法

2 softmax 回归

图像分类、垃圾邮件识别、交易诈骗识别、恶意软件识别等

softmax运算符将输出值变换成值为正，且和为1的概率分布

交叉熵损失函数：更适合衡量两个概率分布差异

softmax 回归是一个单层神经网络，输出个数等于类别个数

3 多层神经网络

激活函数：一种非线性函数

ReLU函数：只保留正数元素，负数元素清零

sigmoid函数：将元素值变换到0到1

tanh(双曲正切)：元素值变换到-1到1

4 模型选择

模型在训练集上更准确时，不代表在测试集上就一定准确

训练误差：训练数据集上表现出的误差；泛化误差：模型在测试集上表现的误差期望

机器学习需要关注降低泛化误差

模型选择：评估若干候选模型的表现并从中选择模型

候选模型可以是有着不同超参数的同类模型

验证集：预留训练和测试集之外的数据；

最低0.47元/天解锁文章

关注

1
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。