神经网络（四）—— 梯度下降和Tensorflow简介

最新推荐文章于 2021-10-09 16:51:17 发布

HikariXuXu

最新推荐文章于 2021-10-09 16:51:17 发布

阅读量240

点赞数

分类专栏：神经网络文章标签：神经网络深度学习机器学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/HikariXuXu/article/details/107911959

版权

神经网络专栏收录该内容

4 篇文章 0 订阅

订阅专栏

本系列为慕课网《深度学习之神经网络(CNN/RNN/GAN)算法原理+实战》视频笔记，希望自己能通过分享笔记的形式更好的掌握该部分内容。
往期回顾：
神经网络（一）—— 机器学习、深度学习简介
神经网络（二）—— 神经元、Logistic回归模型
神经网络（三）—— 神经元多输出

神经网络训练

由于需要求解的参数众多、约束条件是数据，所以不能用直接求解的方式计算神经网络参数。

下山算法：找到方向→走一步→找方向→走一步→···

在神经网络中有一个类似的算法：梯度下降算法
$\theta=\theta-\alpha\frac{\partial L(x,y)}{\partial \theta}$
其中 $\theta$ 是参数， $\alpha$ 是学习率。整体的思路就是找到使损失函数下降最快的方向更新参数。
fig1. 学习率的大小影响学习程度
在这一步， $\alpha$ 是一个很重要的参数。 $\alpha$ 如果过大，会导致Loss上升，举个例子，一个人从太行山下山，结果步子过大，走到了喜马拉雅山。 $\alpha$ 如果过小，则下山速度太慢。 $\alpha$ 虽然不是特别大，但还是大了些，它始终走不进去往山底的小路。只有适合的 $\alpha$ 才能更好更快的走到最低点。

Tensorflow基础

Tensorflow介绍

Google Brain的第二代机器学习框架
开源社区活跃
可扩展性好
API健全，对用户友好

计算图模型

命令式编程
声明式编程

它的计算图是：

为什么要介绍计算图？由于神经网络的结构是定义好的，而x是用户输入的，所以定义神经网络的时候并不知道数据是什么，需要使用计算图。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
神经网络（四）—— 梯度下降和Tensorflow简介

本文简要介绍梯度下降算法和Tensorflow。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。