《Python深度学习——基于PyTorch》ch05机器学习基础笔记

最新推荐文章于 2024-06-18 09:16:39 发布

张欣-男

最新推荐文章于 2024-06-18 09:16:39 发布

阅读量284

点赞数

分类专栏：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sdlypyzq/article/details/107990221

版权

深度学习专栏收录该内容

15 篇文章 0 订阅

订阅专栏

5.1 机器学习的基本任务

监督学习
- 分类
- 回归
- 目标检测
- 识别
无监督学习
- 聚类
- 降维
半监督学习
- 自编码
- 推荐
- 生成式对抗
强化学习
- 分类
- 回归

5.2 机器学习的一般流程

定义问题
明确目标
收集数据
数据探索与预处理
选择模型及损失函数
评估及优化模型

5.3 过拟合与欠拟合

权重正则化
Dropout正则化
Batch Normalization
权重初始化

5.4 选择合适的激活函数

sigmoid
表达式： $f(x)=\frac {1} {1+e^{-x}}$
导数：
tanh
$f(x)=\frac {1-e^{-2x}} {1+e^{-2x}}$

【注意】书中89页下边tanh公式写少写了个负号。

relu
LeakyReLU
softmax

5.5 选择合适的损失函数

训练模型的过程实际就是优化损失函数的过程。

分类问题——交叉熵（Cross Entropy)
交叉熵反应的是两个概率分布之间的距离。
交叉熵损失又称对数似然损失。
回归问题——均方误差（Mean Sequared error, Mse）

5.6 选择合适优化器

5.6.1 传统梯度优化的不足

对超参数学习率比较敏感。
容易卡在鞍点上。

5.6.2 动量算法

动量（Momentum）算法：每下降一步由前面下降方向的一个累积和当前点的梯度方向组合而成。
NAG算法：按照前面一小步位置的超前梯度来做梯度合并。

5.6.3 AdaGrad 算法

能自动调整模型参数的学习率。

5.6.4 RMSProp 算法

超参数\rho$ 用来控制移动平均的长度范围。

5.6.5 Adam 算法

带有动量项的 RMSProp 算法

5.7 GPU加速

5.7.1 单GPU加速

torch.cuda.is_available() GPU是否可用。
torch.cuda.device_count() 获得能够使用的GPU的数量
to(device) .cuda() 从内存转到GPU

5.7.2 多GPU加速

单机多GPU DataParallel
多机多GPU DistributedParallel

5.7.3 使用GPU注意事项

GPU数量尽量为偶数
数据量小时多GPU未必更快。
内存不够大，可设置pin_memory为false。

参考

《Python深度学习基于Pytorch》

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

张欣-男 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。