线性模型利用输入特征的线性函数进行预测,学习线性模型的算法的区别:
(1)系数和截距的特定组合对训练数据拟合好坏的度量方法,不同的算法使用不同的方法度量“对训练集拟合好坏”–称为损失函数
(2)是否使用正则化,使用哪种正则化方法
线性模型的主要参数是正则化参数,如果假定只有几个特征是真正重要的,应该用L1正则化,否则应默认使用L2正则化。
处理大型数据时,需研究使用LogisticRegression和Ridge模型的solver='sag’选项,比默认值要更快。
用于回归的线性模型
y = w i ∗ x i + b y=w_i*x_i + b y=wi∗xi+b
x i x_i xi是单个数据点的特征, w i w_i wi