线性回归与逻辑回归

最新推荐文章于 2021-02-02 21:47:24 发布

Nautilus_sailing

最新推荐文章于 2021-02-02 21:47:24 发布

阅读量386

点赞数

分类专栏： machine learning

本文链接：https://blog.csdn.net/baidu_38060633/article/details/79242532

版权

一、线性回归

问题概述

线性回归要解决的问题是给一堆样本点X(m, n)和每个点对应的函数值Y(m,1)要求找到一个线性函数 $y = w_1 * x_1 + w_2 * x_2 + ... + w_n * x_ n + b$ 使得其对原样本点的拟合度最好。拟合度最好就是每个样本点到这条直线的距离和最小，转化成数学语言就是使得误差函数 $J(\hat{y}, y ) = 1/2 * (\hat{y}-y)^2 = 1/2 * (w^Tx + b - y)^2$ 最小，选平方函数消除误差的正负情况。

公式推导及实现

令误差函数对两参数的倒数分别为0，即可得出其表达式。但最后 $\theta(w, b) = (X^TX)^{-1}X^TY$ 高维矩阵的逆不易算，而且存在矩阵不可逆的情况。实现上往往采用梯度下降法： $\theta = \theta - \alpha \frac{\partial J(w, b)}{\partial \theta}$ ，下面做个简单的示例。首先统一样本及标签矩阵的格式如下：

样本特征矩阵是 n×m 的，其中 n 是每个样本的特征数，m是样本个数。标签y为 1×m 的行向量。按此格式生成100个样本点：

import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline

def generate_data():
    x = np.linspace(-2, 2, 100).reshape(100, 1)
    y = -3 * x + 7 + (np.random.rand(100, 1) - 0.5)
    return x, y

x, y = generate_data()
x = x.T
y = y.T

print(x.shape,)
print(y.shape,)

((1, 100),)
((1, 100),)

拟合函数为 $y = -3 * x + 7$ ，每个样本点加一个噪声。作图如下：

plt.figure(figsize=(12, 8))

plt.scatter(x.T, y.T, c= 'y')
plt.plot(x.T, (-3 * x + 7).T, c='b', linewidth=2)
plt.show()

接下来就用梯度下降法得到使得误差函数最小的 $w,b$ 。参数更新公式推导： J(y^,y)=1

最低0.47元/天解锁文章

Nautilus_sailing

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
线性回归与逻辑回归

一、线性回归问题概述线性回归要解决的问题是给一堆样本点X(m, n)和每个点对应的函数值Y(m,1)要求找到一个线性函数y=w1∗x1+w2∗x2+...+wn∗xn+b" role="presentation">y=w1∗x1+w2∗x2+...+wn∗xn+by=w1∗x1+w2∗x2+...+wn∗xn+by = w_1 * x_1 +
复制链接

扫一扫