3.1 基本形式
给定由d个属性描述的示例,其中
是x的第i个属性上的取值,线性模型试图学得一个通过属性的线性组合来进行预测的函数, 即
一般用向量形式写成
其中.
和b学得之后,模型就可以确定。
3.2 线性回归
给定数据集,其中
。”线性回归“试图学得一个线性模型以尽可能准确地预测实值输出标记。我们先考虑最简单的情形:输入属性的数目只有一个。为便于讨论,此时我们忽略关于属性的下标,即
,其中
.对离散属性,若属性间存在”序“关系,可通过连续化将其转化为连续值,例如二值属性”身高“的取值”高“”矮“可转化为{1.0, 0.0},三值属性”高度“的取值”高“”中“”低“可转化为{1.0, 0.5, 0.0};若属性间不存在序关系,假定有k个属性值,则通过转化为k维向量。
为确定和b,由于均方误差时回归任务中最常用的性能度量,因此我们可让均方误差最小化,即
均方误差有非常好的集合意义,它对应了常用的欧几里得距离或简称”欧式距离“。基于均方误差最小化来进行模型求解的方法称为”最小二乘法“。在线性回归中,最小二乘法就是试图找到一条直线,使所有样本到直线上的欧式距离之和最小。
求解和b使
最小化的过程,称为线性回归模型的最小二乘”参数估计“。我们可将
分别对
和b求导,得到
然后令上面两式为0可得到和b最优解的闭式解,即:
其中为x的均值。
更一般的情形是如本节开头的数据集D,样本有d个属性描述。此时我们试图学得,使得
,这就称为“多元线性回归”。类似的,可利用最小二乘法对
和b进行估计。为便于讨论,我们把
和b吸收入向量形式
,相应的,把数据集D表示为一个
大小的矩阵X,其中每行对应一个示例,该行前d个元素对应于示例的d个属性值对应于示例的d个属性值,最后一个元素横置为1,即:
再把标记也写成标量的形式,有
。
令,对
求导得到
,令其为0可得
最优解的闭式解,此时我们做一个简单的讨论。当
为满秩矩阵或正定矩阵时,令前面的式子为0可得
。令
,则最终学得的多元线性回归模型为
。