机器学习中用于分类和回归的模型中,线性模型是最简单的模型了,最近看了Pattern Recognition and Machine Learning中线性模型的部分,这里把其中的几个个人认为比较重要的地方记下来,算是做笔记了
线性模型是因为模型对其中的参数是线性的,但对输入的向量(特征)并不一定是线性的,因为基函数(basic function)可能不是线性的
最简单的线性模型
使用基函数的线性模型
其它基函数还有
高斯基函数:
S(sigmoidal)基函数:
还有常用于三角函数的傅里叶基函数,用于信号处理的小波(wavelet)基函数
假设目标变量取样与确定函数和高斯噪声:
那么有 : 和
似然函数:
log形式:
其中:
由Ed的形式可以看出最大似然(ML)和最小二乘是一致的
上式可以通过一个Moore-Penrose pseudo-inverse矩阵来求解
同时可以得到偏移值w0是目标值均值与基函数均值的差
还有precision的取值:
最小二乘法的几何意义可以看做是目标值在有基函数确定的向量空间的投影
连续学习用于数据量很大或在线学习
正则最小二乘是对权值加了约束的最小二乘:
当q等于1是,在统计学文献中被称为lasso,因为这有助于是权值稀疏,可以直观地由下图得到
当有多个输出的时候与单一输出基本是一致的