Pytorch系列笔记（三）

最新推荐文章于 2024-06-26 14:21:05 发布

桂花鱼_

最新推荐文章于 2024-06-26 14:21:05 发布

阅读量554

点赞数

分类专栏： pytorch笔记文章标签： python 深度学习机器学习算法神经网络

本文链接：https://blog.csdn.net/qq_45866407/article/details/108046195

版权

pytorch笔记专栏收录该内容

13 篇文章 2 订阅

订阅专栏

我们主要来分析一下梯度下降法。以上文的根据学习时间来预测学习成绩的模型为例，上文中我们提到在𝜔=2时可以取得最优的解，如下图所示：
在这里插入图片描述
但是如果我们遇到更加复杂的问题，仅仅通过我们上述的分析，也可以直接得到𝜔的最优解嘛？显然是不可以的。那么我们就要避免𝜔陷入局部最优解。
于是我们可以通过求𝜔在不同位置的梯度来使得我们向着最优值的方向前进。
在这里插入图片描述

我们可以通过不断地迭代上述的过程来得到我们的最优解。具体数学部分如下：
下面我们可以分析相关的代码：

x_data = [1.0, 2.0, 3.0]
y_data = [2.0, 4.0, 6.0]
w = 1.0
def forward(x):
return x * w
def cost(xs, ys):
cost = 0
for x, y in zip(xs, ys):
y_pred = forward(x)
cost += (y_pred - y) ** 2
return cost / len(xs)
def gradient(xs, ys):
grad = 0
for x, y in zip(xs, ys):
grad += 2 * x * (x * w - y)
return grad / len(xs)
print('Predict (before training)', 4, forward(4))
for epoch in range(100):
cost_val = cost(x_data, y_data)
grad_val = gradient(x_data, y_data)
w -= 0.01 * grad_val
print('Epoch:', epoch, 'w=', w, 'loss=', cost_val)
print('Predict (after training)', 4, forward(4))

跟上文的代码相比不同之处就在于运用的梯度下降的基本思想。

在这里插入图片描述
以下是结果展示：

我们还可以用SGD方法来进行进一步的优化，减少了相关的一部分的计算。

代码如下：

x_data = [1.0, 2.0, 3.0]
y_data = [2.0, 4.0, 6.0]
w = 1.0
def forward(x):
return x * w
def loss(x, y):
y_pred = forward(x)
return (y_pred - y) ** 2
def gradient(x, y):
return 2 * x * (x * w - y)
print('Predict (before training)', 4, forward(4))
for epoch in range(100):
for x, y in zip(x_data, y_data):
grad = gradient(x, y)
w = w - 0.01 * grad
print("\tgrad: ", x, y, grad)
l = loss(x, y)
print("progress:", epoch, "w=", w, "loss=", l)
print('Predict (after training)', 4, forward(4))

桂花鱼_

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Pytorch系列笔记（三）

我们主要来分析一下梯度下降法。以上文的根据学习时间来预测学习成绩的模型为例，上文中我们提到在????=2时可以取得最优的解，如下图所示：但是如果我们遇到更加复杂的问题，仅仅通过我们上述的分析，也可以直接得到????的最优解嘛？显然是不可以的。那么我们就要避免????陷入局部最优解。于是我们可以通过求????在不同位置的梯度来使得我们向着最优值的方向前进。我们可以通过不断地迭代上述的过程来得到我们的最优解。具体数学部分如下：下面我们可以分析相关的代码：x_data = [1.0, 2.0,
复制链接

扫一扫

专栏目录