一.深度学习简介

最新推荐文章于 2023-06-29 18:53:45 发布

学术界抗把子

最新推荐文章于 2023-06-29 18:53:45 发布

阅读量140

点赞数

分类专栏：深度学习框架-pytorch

本文链接：https://blog.csdn.net/weixin_43773557/article/details/103325428

版权

3 篇文章 0 订阅

订阅专栏

***deep learning***

正则化：为了防止过拟合现象，加入正则化项，常用有L1范数和L2范数。

L0范数：||x||0为x向量各个非零元素的个数
L1范数：||x||1为x向量各个元素绝对值之和
L2范数：||x||2为x向量各个元素平方和的开方
Lp范数：||x||p为x向量各个元素 p次方和的1/p方
L∞范数：||x||∞为x向量各个元素绝对值最大那个元素的绝对值

正常的正则化除了L1、L2正则化，还有常用的Dropout方法，以概率舍弃部分神经元，
在这里插入图片描述

批量梯度下降（BGD-batch gradient descent）:每一步迭代都使用训练集的所有内容，能够保证计算出的梯度为0，不需要逐渐减小学习率，但计算量巨大。
随机梯度下降（SGD-stochastic gradient descent）:随机抽取样本更新参数。速度快，但每次优化方向不一定全局最优，最终结果在全局最优解的附近。

动量：前几次的梯度会参与计算。
前后梯度一致时，加速学习；不一致时，抑制震荡

补充…

关注