回归与聚类——岭回归（四）

最新推荐文章于 2024-06-15 07:37:12 发布

绿树疯子

最新推荐文章于 2024-06-15 07:37:12 发布

阅读量312

点赞数 3

分类专栏：机器学习文章标签：回归聚类数据挖掘

本文链接：https://blog.csdn.net/qq_37441377/article/details/138118460

版权

机器学习专栏收录该内容

23 篇文章 0 订阅

订阅专栏

岭回归，其实也是一种线性回归。只不过在算法建立回归方程时候，加上正则化的限制，从而达到解决过拟合的效果。

带有L2正则化的线性回归——岭回归

1API

sklearn.linear_model.Ridge(alpha=1.0,fit_intercept=True,solver=“auto” normalize=False)
- 具有L2正则化的线性回归
- alpha：正则化力度（=惩罚项系数），也叫λ
  - λ取值：0 ~ 1 1 ~ 10
- solver：会根据数据自动选择优化方法
  - sag：如果数据集、特征都比较大，选择该随机梯度下降优化
- normalize：数据是否进行标准化
  - normalize=False：可以在fit之前调用preprocessing.StandardScaler标准化数据
- Ridge.coef_：回归权重
- Ridge.intercept_：回归偏置中

Ridge方法相当于SGDRegressor(penalty=‘l2’,loss=“squared
loss”)，只不过SGDRegressor实现了一个普通的随机梯度下降学习，推荐使用Ridge（实现了SAG）

sklearn.linear model.RidgeCV(_BaseRidgeCV, RegressorMixin)
- 具有12正则化的线性回归，可以进行交叉验证
- coef_：回归系数

class BaseRidgecV(LinearModel):
	def__init__(self, alphas=(0.1,1.0,10.0),
			  fit intercept=True, normalize=False,scoring=None,
			  cv=None, gcv mode=None,
			  store_cv_values=False):