size in feet²(x) | price($)in 1000‘s(y) |
---|---|
2104 | 460 |
1416 | 232 |
1534 | 315 |
852 | 178 |
m→训练样本的数目 (例如上述表格有四行就有4个样本数目,有多少行就有多少样本数目)
x‘s→输入变量或者目标变量
y’s→输出变量或者目标变量
(x,y)则表示一个训练样本
1概念:
线性回归就是分析特征和目标之间的关系。我的理解:是找到一个合适的函数,将变量和目标联系起来,并且这个关系呈线性变化。
标题1.1 线性回归的函数模型:
h
θ
(
x
)
=
θ
T
x
h_\theta(x)=\theta^Tx
hθ(x)=θTx
这其实就是一个简单的过原点的线性函数。
2解决方法:
梯度下降。我的理解:引入梯度下降是为了对损失函数进行评价,它是测量这个线性回归是否合适的标准:如果损失函数越小,那么这个线性回归越能表现出变量和目标之间的关系。
2.1线性回归损失函数:
j ( θ ) = 1 2 m ∑ i = 1 m ( h θ ( x i ) − y i ) 2 j(\theta)=\frac{1}{2m}\sum_{i=1}^m( h_\theta(x^{i}) - y^{i})^2 j(θ)=2m1∑i=1m(hθ(xi)−yi)2
2.2梯度下降公式:
θ = θ − α ⋅ d J ( θ ) d θ \theta=\theta-\alpha·\frac{dJ(\theta)}{d\theta} θ=θ−α⋅dθdJ(θ)
公式思想:α为学习度,它就像走路时的步幅大小:α过大会错过最小的损失函数,α太小会增加计算次数。所以寻找合适的α也很重要。
参考文献
线性回归笔记:https://blog.csdn.net/qq_14993591/article/details/100823034