吴恩达线性回归模型_作业1

最新推荐文章于 2022-07-31 20:44:59 发布

矩阵科学

最新推荐文章于 2022-07-31 20:44:59 发布

阅读量358

点赞数

分类专栏：机器学习与数据分析文章标签：线性回归模型线性回归

本文链接：https://blog.csdn.net/cj151525/article/details/116591702

版权

机器学习与数据分析专栏收录该内容

19 篇文章 10 订阅

订阅专栏

线性回归模型总结

线性模型就是使用一条曲线模拟样本分布，例如 $y = a x + b$ 、 $y=ax^{3}+bx^{2}+cx+d$ 等等，甚至可以使用更高维的模型，但是需要防止过拟合问题。确定好了模型，唯一需要做的事情就是求出参数abcd，即解模型参数。那么如何求出参数呢？

我们把各种模型分为有监督与无监督模型，有监督模型即要求样本有真实标签，我们需要使用真实标签指导完成求参工作。而无监督模型不要求样本带有真实标签。有监督模型又可以分为分类模型与回归模型，其中分类模型有逻辑回归、决策树等，回归模型有线性回归模型。

线性回归模型是有监督的回归问题，那么就需要使用真实标签来指导求解参数。就好像大炮弹，首先我们乱射一个角度，然后看一下真实目标与实际打中的目标的差距，然后我们就可以根据这个差距调整大炮的角度。而这个衡量误差的函数就是平方误差代价函数：

$J\left(\theta_{0}, \theta_{1}\right)=\frac{1}{2 m} \sum_{i=1}^{m}\left(h_{\theta}\left(x^{(i)}\right)-y^{(i)}\right)^{2}$
至此我们只需要调整参数，使得代价函数J最小，从而使用梯度下降法对J函数进行优化，求解一组合适的参数 $\theta$ 。综上这就是线性回归模型，在此感谢吴恩达老师的系列课程！

下面是线性回归模型的例子，实现使用的是非矩阵法，其缺点就是运行慢

import numpy as np
import pandas as pd
import matplotlib as mpl

#线性回归出公式  y=2x+1  
x=[1,2,3,4,5,7,8]
y=[3,5,7,9,11,15,17]
#下列参数分别为：梯度下降的次数、模型参数1、模型参数2、样本个数、学习率
count=1000;w0=0;w1=0;m=len(x);a=0.01

这里定义的线性模型为 $y = w 0 * x + w 1$ ,如下代码所示：

#定义线性模型
def model(x):
    return w0*x+w1

#定义损失函数
def loss(true_y,pre_y):
    return (true_y-pre_y)**2

下面使用 $\theta_{0}$ , $\theta_{1}$ 替代代码中的w1,w0，代价函数为： $J\left(\theta_{0}, \theta_{1}\right)=\frac{1}{2 m} \sum_{i=1}^{m}\left(h_{\theta}\left(x^{(i)}\right)-y^{(i)}\right)^{2}$

对w1求偏导后得到：
$\frac{\partial}{\partial \theta_{0}} J\left(\theta_{0}, \theta_{1}\right)=\frac{1}{m} \sum_{i=1}^{m}\left(h_{\theta}\left(x^{(i)}\right)-y^{(i)}\right)$

对w0求偏导后得到：
$\frac{{\partial}}{\partial \theta_{1}} J\left(\theta_{0}, \theta_{1}\right)=\frac{1}{m} \sum_{i=1}^{m}\left(h_{\theta}\left(x^{(i)}\right)-y^{(i)}\right) \cdot x^{(i)}$
对于上面的系列公式要解释的是，对于代价函数中的 $\left(h_{\theta}\left(x^{(i)}\right)-y^{(i)}\right)^{2}$ h(x)与y是可以换位置的，那可能有人会问那么求偏导岂不是要加一个负号了。答案是：保持原来的偏导不变，因为调换了h与y求偏导时就变成了(y-h)了，但是有一点别忘记还要对h对w1求偏导，这样就又提出了一个负号，负负得正，所以还是原来的那个式子。这也就从侧面解释了代价函数中真实值减预测值可以、预测值减真实值也行！这是我刚学习这里时让我疑惑的地方。

#代价函数对w1求偏导
def partial_w1(true_y,xi):
    return (1/m)*(model(xi)-true_y)

#对代价函数w0求偏导
def partial_w0(true_y,xi):
    return (1/m)*(model(xi)-true_y)*xi

cost = []
for i in range(count):
    # 梯度下降count次
    #     print(str(w0)+" "+str(w1))
    temp=0
    part0 = 0
    part1 = 0
    for j in range(m):
        # 求解代价函数值
        temp += (1 / (2 * m)) * loss(y[j], model(j))
        part0 += partial_w0(y[j], x[j])
        part1 += partial_w1(y[j], x[j])
    if(count%10==0):
        cost.append(temp)
    # 更新参数w0与w1
    w0 -= a * part0
    w1 -= a * part1
print(len(cost))
print(str(w0)+" "+str(w1))

1000
2.0114619613824907 0.9364211186107142

import matplotlib.pyplot as plt
# 这两行代码使得 pyplot 画出的图形中可以显示中文
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False

# 设置Y轴的刻度范围
# plt.ylim([0,100])
plt.plot(range(60), cost[0:60], '-', label='代价值')
# plt.xticks(range(count))  # 设置横坐标刻度
plt.xlabel('梯度下降次数') # 设置横坐标轴标题
plt.legend() # 显示图例，即每条线对应 label 中的内容
plt.show() # 显示图形

在这里插入图片描述

以下是向量矩阵实现,运算速度是非矢量方法的300倍左右

x=np.array(x)
y=np.array(y)
cost=np.zeros(count)
for i in range(count):
    pre_y=w0*x+w1
    cost[i]=np.sum((pre_y-y)**2)/(2*m)
    part0=np.sum(x.T*(pre_y-y))/m
    part1=np.sum(pre_y-y)/m
    w0-=a*part0
    w1-=a*part1
print(str(w0)+"    "+str(w1))
# print(cost)