什么是sgd;深度学习,视频笔记;DL: codebasics

先说说 batch gradient descent

你有 一批数据,不算多;

假定我们在训练 一个 房价预测 器

这个 预测器,这个模型,就是个 线性的,有个 线性的 函数 来表达 我们的这个机器学习 模型:

在这里插入图片描述
上图 展示 了 用 这一批 的第二个 数据 进行 error 计算 的 样子

6 个数据 一旦 都计算完了,就叫做 end of one epoch

好了,在这个 epoch 的结束 那一瞬间,我们要计算 权重的更新:

在这里插入图片描述
好了,权重如上进行了更新

然后 下一个 epoch 再计算 这 6 个数据的loss;

做完你 规定 的epoch ,我们的模型就训练好了。

在这里插入图片描述

那什么是 sgd 呢?

你有非常多的 sample

你电脑 肯定扛不住,累死他;
在这里插入图片描述

sgd 面对大量数据比较好,它是怎么做的?

  1. 随机选 sample 在这里插入图片描述
  2. 更新所有的 权重比如 w1 ,w2在这里插入图片描述
  3. 重复上述 1和 2 ,你就得到 sgd在这里插入图片描述

对比 batch gradient descent 和 stochastic grandient descent

在这里插入图片描述

mini batch GD

sgd 是 随机选 一个

我随机选 一批

在这里插入图片描述

综合对比三者

在这里插入图片描述

参考

https://www.youtube.com/watch?v=IU5fuoYBTAM

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
深度学习是一种机器学习的方法,通过多层神经网络来学习数据的特征表示。神经网络是由许多神经元(或节点)组成的网络,每个神经元可以通过权重和激活函数来对输入进行加权和非线性变换。 在深度学习中,数据通常表示为张量(tensor),它是一个多维数组。张量由一个或多个轴组成,每个轴表示数据的一个维度。常见的张量有标量(0维)、向量(1维)、矩阵(2维)等。 了解张量和神经网络后,我们可以开始实现深度学习模型。其中一个常用的深度学习框架是TensorFlow。TensorFlow是一个开源的Python库,可以用于构建和训练神经网络模型。 在TensorFlow中,我们可以通过定义网络的架构,包括层和节点的连接方式来构建神经网络模型。可以使用各种各样的层,如全连接层、卷积层和池化层等来构建模型。在每个层中,可以使用不同的激活函数来引入非线性。 一旦模型被构建,我们需要进行训练。在训练过程中,我们将数据输入模型中,并根据定义的损失函数来计算模型的预测误差。通过反向传播算法,我们可以根据这些误差来调整网络中的权重和偏差,以使模型的性能不断改进。 TensorFlow还提供了一些优化器,如随机梯度下降(SGD)等,用于自动计算和调整权重和偏差。此外,TensorFlow还支持分布式计算和GPU加速,可以加快计算速度。 通过图解深度学习与神经网络,我们可以更好地理解深度学习的原理和实现。通过学习如何使用TensorFlow构建和训练神经网络模型,我们可以更好地应用深度学习来解决各种各样的问题,如图像分类、语音识别和自然语言处理等。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值