深度学习（2）回归问题

最新推荐文章于 2023-11-01 16:26:36 发布

炎武丶航

最新推荐文章于 2023-11-01 16:26:36 发布

阅读量1.3k

点赞数 1

分类专栏：深度学习文章标签：深度学习 tensorflow

本文链接：https://blog.csdn.net/weixin_43360025/article/details/119464457

版权

深度学习专栏收录该内容

125 篇文章 54 订阅

订阅专栏

深度学习（2）回归问题

一. 问题提出与解析
二. 回归问题实战

一. 问题提出与解析

1. Machine Learning

make decisions
going left/right $\to$ discrete
increase/decrease $\to$ continuous

2. Continuous Prediction

在这里插入图片描述

$f_θ:x→y$
$x : i n p u t d a t a$
$f (x) : p r e d i c t i o n$
$y : r e a l d a t a, g r o u n d - t r u t h$

3. Linear Equation

y=w*x+b
1.567=w*1+b
3.043=w*2+b

$\to$ Closed Form Solution

w=1.477
b=0.089

4. With Noise?

y=w*x+b+ϵ
ϵ ~ N(0,1)
1.567=w*1+b+eps
3.043=w*2+b+eps
4.519=w*2+b+eps
…
$\to$
Y=(WX+b)

For Example
在这里插入图片描述

5. Find $w^{'}$ ， $b^{'}$

$WX+b-Y)]^2$
$loss=\sum_i{(w*x_i+b-y_i)^2}$
$Minimize\ loss$
$w^{'} * x + b^{'} \to y$

6. Gradient Descent

(1) 1-D
$w'=w'-lr*\frac{dy}{dw}$
在这里插入图片描述

$x'=x-0.005*\frac{dy}{dw}$
可以看到，函数的导数始终指向函数值变大的方向，因此，如果要求 $l o s s$ 函数的极小值的话，就需要沿导数的反方向前进，即 $-lr*\frac{dy}{dw}$ ，衰减因子 $l r$ 的引入是为了防止步长变大，跨度太大。
(2) 2-D
在这里插入图片描述
Find $w^{'}, b^{'}$

$loss=\sum_i{(w*x_i+b-y_i)^2}$
分别对w和b求偏导数，然后沿着偏导数的反向前进，即:
- $w'=w-lr*\frac{∂loss}{∂w}$
- $b'=b-lr*\frac{∂loss}{∂b}$
$w^{'} * x + b^{'} \to y$

Learning Process
在这里插入图片描述

Loss surface
在这里插入图片描述

二. 回归问题实战

1. 步骤

(1) 根据随机初始化的 $w, x, b, y$ 的数值来计算 $Loss\ Function$ ;
(2) 根据当前的 $w, x, b, y$ 的值来计算梯度;
(3) 更新梯度，将 $w^{'}$ 赋值给 $w$ ，如此往复循环;
(4) 最后面的 $w^{'}$ 和 $b^{'}$ 就会作为模型的参数。

2. Step1: Compute Loss

共有100个点，每个点有两个维度，所以数据集维度为 $[100, 2]$ ，按照 $x_0,y_0 ),(x_1,y_1 ),…,(x_{99},y_{99} )]$ 排列，则损失函数为:
$loss=[(w_0 x_0+b_0-y_0)]^2+[(w_0 x_1+b_0-y_1)]^2+⋯+[(w_0 x_{99}+b_0-y_{99})]^2$
即:
$loss=\sum_i(w*x_i+b-y_i)^2$
初始值设 $w_0=b_0=0$ 。
在这里插入图片描述

(1) b和w的初始值都为0，points是传入的100个点，是data.csv里的数据;
(2) len(points)就是传入数据点的个数，即100; range(0, len(points))就代表从0循环到100;
(3) x=points[i, 0]表示取第i个点中的第0个值，即第一个元素，相当于p[i][0]; 同理，y=points[i, 1]表示取第i个点中的第1个值，即第二个元素，相当于p[i][1];
(4) totalError为总损失值，除以是len(points)是平均损失值。

3. Step2: Compute Gradient and update

$loss_0=(wx_0+b-y_0)^2$
$\frac{∂loss_0}{∂w}=2(wx_0+b-y_0)x_0$
$\frac{∂loss}{∂w}=2\sum(wx_i+b-y_i)x_i$
$\frac{∂loss}{∂b}=2\sum(wx_i+b-y_i)$
$w'=w-lr*\frac{∂loss}{∂w}$
$b'=b-lr*\frac{∂loss}{∂b}$

4. Step3: Set $w = w^{'}$ and loop

$w \leftarrow w^{'}$
$b \leftarrow b^{'}$
在这里插入图片描述

计算出最终的w和b的值就可以带入模型进行预测了:
$w^{'} x + b^{'} \to p r e d i c t$

5. 代码

import numpy as np


# y = wx + b
def compute_error_for_line_given_points(b, w, points):
    totalError = 0
    for i in range(0, len(points)):
        x = points[i, 0]
        y = points[i, 1]
        # computer mean-squared-error
        totalError += (y - (w * x + b)) ** 2
    # average loss for each point
    return totalError / float(len(points))


def step_gradient(b_current, w_current, points, learningRate):
    b_gradient = 0
    w_gradient = 0
    N = float(len(points))
    for i in range(0, len(points)):
        x = points[i, 0]
        y = points[i, 1]
        # grad_b = 2(wx+b-y)
        b_gradient += (2 / N) * ((w_current * x + b_current) - y)
        # grad_w = 2(wx+b-y)*x
        w_gradient += (2 / N) * x * ((w_current * x + b_current) - y)
    # update w'
    new_b = b_current - (learningRate * b_gradient)
    new_w = w_current - (learningRate * w_gradient)
    return [new_b, new_w]


def gradient_descent_runner(points, starting_b, starting_w, learning_rate, num_iterations):
    b = starting_b
    w = starting_w
    # update for several times
    for i in range(num_iterations):
        b, w = step_gradient(b, w, np.array(points), learning_rate)
    return [b, w]


def run():
    points = np.genfromtxt("data.csv", delimiter=",")
    learning_rate = 0.0001
    initial_b = 0  # initial y-intercept guess
    initial_w = 0  # initial slope guess
    num_iterations = 1000
    print("Starting gradient descent at b = {0}, w = {1}, error = {2}"
          .format(initial_b, initial_w,
                  compute_error_for_line_given_points(initial_b, initial_w, points))
          )
    print("Running...")
    [b, w] = gradient_descent_runner(points, initial_b, initial_w, learning_rate, num_iterations)
    print("After {0} iterations b = {1}, w = {2}, error = {3}".
          format(num_iterations, b, w,
                 compute_error_for_line_given_points(b, w, points))
          )


if __name__ == '__main__':
    run()

运行结果如下:
在这里插入图片描述

可以看到，在 $w = 0, b = 0$ 的时候，损失值 $e r r o r \approx 5565.11$ ;
在1000轮迭代后， $w \approx 1.48, b \approx 0.09$ ，损失值 $e r r o r \approx 112.61$ ，要大大小于原来的损失值。

参考文献:
[1] 龙良曲:《深度学习与TensorFlow2入门实战》

炎武丶航

关注

1
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
深度学习（2）回归问题

深度学习（2）回归问题一. 问题提出与解析1. Machine Learning2. Continuous Prediction3. Linear Equation4. With Noise?5. Find w′w'w′，b′b'b′6. Gradient Descent二. 回归问题实战1. 步骤2. Step1: Compute Loss3. Step2: Compute Gradient and update4. Step3: Set w=w′w=w'w=w′and loop5. 代码一. 问题提出
复制链接

扫一扫