TensorFlow指南(四)——练习思考:深度神经网络(初级)

本文地址: http://blog.csdn.net/u011239443/article/details/71173351

为什么使用逻辑回归分类器而不是经典感知器(例如:用感知器训练算法训练的一层线性阈值单元)?如何调整感知器使其与逻辑回归分类器等效?

只有当数据集是线性可分的时,经典的感知器才会收敛,并且它无法估计类概率。相反,逻辑回归分类器将收敛于一个好的解决方案,即使数据集不是线性可分的,它也会输出类的概率。如果你改变感知器的激活函数为逻辑激活函数(或softmax),用梯度下降法训练它(或其他优化算法最小化代价函数,通常是交叉熵),这样就相当于一个逻辑回归分类器。

假设你有一个由一个输入层组成的MLP,它有10个通道神经元,后面是一个隐藏的层,有50个人工神经元,最后一个输出层有3个人工神经元。所有的人工神经元都使用了相关的激活功能。
- 输入矩阵X的形状是什么?
- 那么隐藏层的权重矩阵 Wh 的形状,以及它的偏差向量’bh’的形状呢?
- 输出层的权重矩阵 和它的偏差向量’bo’的形状是什么?
- 网络的输出矩阵Y的形状是什么?
- 写出计算网络输出矩阵Y的方程,它是X、Wh、bh、“Wo”和“bo”的函数。

  • 输入矩阵X的形状是 m*10,m表示训练批的大小。
  • 隐藏层的权重矩阵的形状是10*50,它的偏置向量的长度是50。
  • 输出层的权向量的形状是 50*3,而它的偏置向量的长度是3。
  • 网络的输出矩阵Y的形状是 m*3。
  • Y = (X * Wh + bh) * Wo + bo。注意,当你在矩阵中添加一个偏差向量时,它会被添加到矩阵中的每一行中,也就是所谓的广播。

如果你想将电子邮件分类为是否垃圾邮件,你需要在输出层中需要多少个神经元?在输出层中应该使用什么激活函数?如果你想要处理MNIST,在输出层中需要多少个神经元,使用什么激活函数?同样的问题,预测房价呢?

分类电子邮件分类是否为垃圾邮件,只需要一个神经网络输出层中的一个神经元,这就表明电子邮件是垃圾邮件的可能性。在估计概率时,通常会使用输出层中的逻辑激活函数。如果你想要处理MNIST,你需要在输出层中使用10个神经元,你必须用softmax激活函数来代替逻辑函数,它可以处理多个类,每个类输出一个概率。如果你想让你的神经网络来预测房价,那么你需要一个输出神经元,在输出层中不使用任何激活函数。

什么是反向传播,它是如何工作的?反向传播和反向模式autodiff的区别是什么?

反向传播是一种用于训练人工神经网络的技术。它首先计算每个模型参数(所有的权重和偏差)的成本函数的梯度,然后使用这些梯度执行梯度下降步骤。这个反向传播步骤通常执行数千或数百万次,使用许多训练批,直到模型参数收敛到(希望)最小化成本函数的值。为了计算梯度,反向传播使用反向模式autodiff(虽然在创建反向传播时并没有调用它,并且它已经被重新设计了好几次)。反向模式autodiff通过计算图执行向前传递,计算当前训练批的每个节点的值,然后执行反向传递,同时计算所有的梯度(请参阅:http://blog.csdn.net/u011239443/article/details/79074931)。所以有什么区别呢?“反向传播”指的是整个过程,训练一个人工神经网络,使用多个反推的步骤,每个步骤都计算梯度,并使用它们来执行梯度下降步骤。相反,反向模式autodiff是一种有效地计算梯度的技术,它恰好被反向传播所使用。

列出能在MLP中调整的所有超参数吗?如果MLP过拟合了训练数据,如何调整这些超参数来解决问题呢?

下面是一个可以在基本的MLP中调整的所有超参数的列表:

  • 隐藏层的数量
  • 每个隐藏层中的神经元数量
  • 每个隐藏层和输出层中使用的激活函数。

一般来说,“ReLU”激活函数是隐藏层的良好的默认值。对于输出层,一般来说,需要的是用于二分类的逻辑激活函数,用于多类分类的softmax激活函数,回归不用激活函数。

如果MLP过拟合训练数据,可以尝试减少隐藏层的数量,减少每个隐藏层的神经元数量。

这里写图片描述

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
对于关注和分享TensorFlow深度学习算法设计的人工智能学习者来说,《深入理解人工智能算法设计》这本书是一本非常宝贵的学习资源。TensorFlow是一个开源的机器学习框架,它提供了丰富的工具和库,可以帮助开发者设计和训练高效的深度学习模型。 这本书对于TensorFlow深度学习的算法设计提供了详细、系统的解读,对于想要深入学习和掌握TensorFlow的人来说非常有帮助。书中包含了各种不同的算法设计案例,从基础的神经网络模型到复杂的深度学习网络,涵盖了各个方面的知识。 通过关注和分享《深入理解人工智能算法设计》这本书,可以帮助更多的人了解和学习TensorFlow深度学习的算法设计。同时,分享这本书也可以推广和宣传TensorFlow这个强大的工具,让更多的人受益于人工智能算法设计的知识。 为了方便更多人获取这本书,《深入理解人工智能算法设计》的PDF版本可以通过下载来获得。PDF格式的书籍可以在各种电子设备上阅读,包括电脑、平板和手机。通过下载PDF版本,学习者可以随时随地地查阅这本书,提高学习效率。 因此,我鼓励大家关注和分享《深入理解人工智能算法设计》这本书,通过深入学习TensorFlow深度学习的算法设计,提升自己在人工智能领域的技能和能力。同时,也希望更多人可以通过下载PDF版本的方式获取这本书,便捷地进行学习。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

小爷毛毛(卓寿杰)

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值