统计学基础_task4

weixin_39208605

于 2019-05-17 20:26:05 发布

阅读量123

点赞数 1

本文链接：https://blog.csdn.net/weixin_39208605/article/details/90299995

版权

线性回归

假设坐标平面内有n点， $x_1 ,y_1)$ , $x_2 ,y_2)$ 等，记为 $x_n ,y_n)$ ，用一条直线进行这些点，希望最小化这些点到直线距离的平方。直线 $y = m x + b$ ，求出 $m, b$ ，使得点和直线y值的平方误差和最小

$Error_1 = y_1-(mx_1+b)$

$Error_2 = y_2-(mx_2+b)$

$S_{Error} =(y_1-(mx_1+b))^2+(y_2-(mx_2+b))^2+……+(y_n-(mx_n+b))^2$

原式= $y^2_1-2y_1(mx_1+b)+(mx_1+b)^2+……+y^2_n-2y_n(mx_n+b)+(mx_n+b)^2$

原式= $y^2_1-2y_1mx_1-2y_1b+m^2x^2_1+2mx_1b+b^2+……+y^2_n-2y_nmx_n-2y_nb+m^2x^2_n+2mx_nb+b^2$ 原式= $(y^2_1+y^2_2+……+y^2_n)-2m(x_1y_1+……+x_ny_n)-2b(y_1+……+y_n)+m^2(x^2_1+……+x^2_n)+2mb(x_1+……x_n)+nb^2$

计算累加项的均值，最小化原式，等价于最小化将累加项改写为均值后的式子

原式= $n\overline{y^2}-2mn\overline{xy}-2nb\overline y + nm^2\overline{x^2}+2mnb\overline x +nb^2$

最小化上式，求m、b分别对m和b求偏导（三维曲面上，最小值点在对m和b的斜率都等于0的位置上）
$KaTeX parse error: Expected 'EOF', got '\and' at position 44: …{\partial m}=0 \̲a̲n̲d̲{\frac{\partial…$
得到
$m=\frac{(\overline y -\frac{\overline {xy}}{\overline x})(\overline x)}{(\overline x - \frac{\overline {x^2}}{\overline x})(\overline x)}=\frac{\overline x \overline y - \overline{xy}}{(\overline x )^2-\overline {x^2}}$