示例 x=(x1;x2;…;xd) x = ( x 1 ; x 2 ; … ; x d )
线性模型试图学得一个通过这d个属性的线性组合来进行预测的函数,即
f(x)=w1x1+w2x2+…+wdxd+b f ( x ) = w 1 x 1 + w 2 x 2 + … + w d x d + b 或写成 f(x)=wT+b f ( x ) = w T + b
其中w和b确定后,模型也就确定了。
w表示了各个属性在这个问题的预测中的重要程度。
线性回归,之前有说回归任务是连续值的情况,那么对于离散属性:
- 若属性值之间有“序”关系,可以通过连续化将其转化为连续值。如三值属性“高度”的取值“高”,“中”,“低”可以转化为{1.0,0.5,0.0}。
- 若属性值之间不存在有序关系,通常转化为k维向量,例如属性“瓜类”的取值“西瓜”,“南瓜”,“黄瓜”可以转化为(0,0,1),(0,1,0),(1,0,0)。
如何确定w和b呢?使用均方误差作为性能度量,让均方误差最小化。对于单个属性