线性回归背景
现在这个数据爆炸的时代,何种数据充斥这我们的生活,我们可以在这些数据中后的有用的信息,比如:我们想买个房子之前会参考相同类型小区房屋面积,位置,楼层,户型等多个因素,以此估计一个心理价位。这是我们人脑的活动,同样可以把这个过程用电脑转化为一个模型(函数或者关系)以此来预测房价。
与此相似,有很多应用:股价,天气等。
构建关系式
线性回归在我看来就是通过大量数据拟合(猜、预测)的一个函数,
比如说哈,我们可以通过一个小区的大量房屋数据,拟合出一个房价与面积,位置,楼层,户型等多个因素之间的关系函数,房价就是因变量y,面积是自变量x1,位置是自变量x2,楼层是自变量x3,户型是自变量x4。而每个自变量对价格的影响又各不相同,所以在x前边得加上各自的权重θ。所以由此公式
而房价y可能与x不是一次方的关系,可能是多阶。所以可以得到