线性回归

本文介绍了线性回归的基本概念,包括如何用f(x)=θ0+θ1x1+θ2x2描述房价与面积、厅室数量的关系。讨论了正规方程和梯度下降法求解线性回归模型,详细阐述了批量梯度下降、随机梯度下降和小批量梯度下降的原理和优缺点。通过向量化表示和损失函数MSE,解释了参数更新的过程。
摘要由CSDN通过智能技术生成

问题引入:房价与其相关因素

面积($x_1$) 厅室数量($x_2)$ 价格(万元)(y)
64 3 225
59 3 185
65 3 208
116 4 508
…… …… ……

我们可以将价格和面积、厅室数量的关系习得为 f ( x ) = θ 0 + θ 1 x 1 + θ 2 x 2 f(x)=\theta_0+\theta_1x_1+\theta_2x_2 f(x)=θ0+θ1x1+θ2x2,使得 f ( x ) ≈ y f(x)\approx y f(x)y,这就是一个直观的线性回归的样式。

线性回归就是对输入特征进行加权求和,再加上一个偏置项(截距项),并以此进行预测
设有数据集 { ( x 1 , y 1 ) , ( x 2 , y 2 ) , . . . , ( x n , y n ) } \{(x_1,y_1),(x_2,y_2),...,(x_n,y_n)\} { (x1,y1),(x2,y2),...,(xn,yn)},其中, x i = ( x i 1 ; x i 2 ; x i 3 ; . . . ; x i d ) , y i ∈ R x_i = (x_{i1};x_{i2};x_{i3};...;x_{id}),y_i\in R xi=(xi1;xi2;xi3;...;xid),yiR

其中 n 表示变量的数量,d 表示每个变量的维度。
可以用以下函数来描述 yx 之间的关系:

KaTeX parse error: No such environment: align* at position 7: \begin{̲a̲l̲i̲g̲n̲*̲}̲ f(x) &= \thet…

  • f ( x ) f(x) f(x) 是预测值
  • d d d 表示特征数量
  • x i x_i xi是第 i i i个特征值
  • θ j \theta_j θj 是第 j j j 个模型参数

向量化表示如下:
$ f(x) = \hat{y} = h_\theta(X) = \theta^TX$
使用均方误差作为性能度量
损失函数:
M S E ( X , h θ ) = 1 m ∑ i = 1 m ( θ T X ( i ) − y ( i ) ) 2 MSE(X, h_\theta) = \frac{1}{m} \sum\limits_{i=1}^{m}(\theta^TX^{(i)} - y^{(i)})^2 MSE(X,hθ)=m1i=1m(θTX(i)y(i))2

正规方程(Normal Equation)



X = [ ( x ( 1 ) ) T ( x ( 2 ) ) T … ( x ( n ) ) T ] X = \left[ \begin{array} {cccc} (x^{(1)})^T\\ (x^{(2)})^T\\ \ldots \\ (x^{(n)})^T \end{array} \right] X=(x(1))T(x(2))T(x(n))T

其中对于每一个 x ( i ) x^{(i)} x(i)

x ( i ) = [ x 1 ( i ) x 2 ( i ) … x d ( i ) ] x^{(i)} = \left[ \begin{array} {cccc} x_1^{(i)}\\ x_2^{(i)}\\ \ldots \\ x_d^{(i)} \end{array} \right]

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值