正则线性模型

最新推荐文章于 2022-09-27 23:24:13 发布

Vxxxx_

最新推荐文章于 2022-09-27 23:24:13 发布

阅读量344

点赞数

文章标签：机器学习

本文链接：https://blog.csdn.net/Vxxxx_/article/details/108562238

版权

正则线性模型

减少模型过拟合的一个好办法是对模型正则化。对于多项式模型，简单办法就是降低多项式的阶数，下面将会使用Ridge回归、Lasson回归、Elastic网络三种方法来对权重进行约束。

岭回归

岭回归是线性回归的正则化版，通过在成本函数中添加一个等于在这里插入图片描述
的正则项，需要注意的是，正则项只能在训练的时候添加到损失函数中，一旦训练完成，需要使用未经正则化的性能指标来评估模型性能。

执行岭回归前，必须对数据做特征缩放，因为其对于输入特征的大小非常敏感。

from sklearn.linear_model import Ridge #使用Ridge回归方法对模型进行处理

np.random.seed(42)
m = 20
X = 3 * np.random.rand(m, 1)
y = 1 + 0.5 * X + np.random.randn(m, 1) / 1.5
X_new = np.linspace(0, 3, 100).reshape(100, 1)

def plot_model(model_class, polynomial, alphas, **model_kargs):
    for alpha, style in zip(alphas, ("b-", "g--", "r:")):
        model = model_class(alpha, **model_kargs) if alpha > 0 else LinearRegression()  #alphas为正则化参数
        if polynomial: #多项式处理方法
            model = Pipeline([
                    ("poly_features", PolynomialFeatures(degree=10, include_bias=False)),
                    ("std_scaler", StandardScaler()),
                    ("regul_reg", model),
                ])
        model.fit(X, y)
        y_new_regul = model.predict(X_new)
        lw = 2 if alpha > 0 else 1
        plt.plot(X_new, y_new_regul, style, linewidth=lw, label=r"$\alpha = {}$".format(alpha))
    plt.plot(X, y, "b.", linewidth=3)
    plt.legend(loc="upper left", fontsize=15)
    plt.xlabel("$x_1$", fontsize=18)
    plt.axis([0, 3, 0, 4])

plt.figure(figsize=(8,4))
plt.subplot(121)
plot_model(Ridge, polynomial=False, alphas=(0, 10, 100), random_state=42)
plt.ylabel("$y$", rotation=0, fontsize=18)
plt.subplot(122)
plot_model(Ridge, polynomial=True, alphas=(0, 10**-5, 1), random_state=42)
plt.show()

在这里插入图片描述
由图看出，正则化参数越高，曲线是也平滑的。
闭式解方法:

# 使用cholesky矩阵因式分解法
from sklearn.linear_model import Ridge
ridge_reg = Ridge(alpha=1, solver="cholesky", random_state=42)
ridge_reg.fit(X, y)
ridge_reg.predict([[1.5]])
array([[1.55071465]])

# 使用随机梯度下降
sgd_reg = SGDRegressor(max_iter=50, tol=-np.infty, penalty="l2", random_state=42)
sgd_reg.fit(X, y.ravel())
sgd_reg.predict([[1.5]])
array([1.49905184])

# sag 随机平均梯度下降
ridge_reg = Ridge(alpha=1, solver="sag", random_state=42)
ridge_reg.fit(X, y)
ridge_reg.predict([[1.5]])
array([[1.5507201]])

以上方法都可以对1.5这个点有个好的预测。

套索回归

又叫做最小绝对收缩和选择算子回归：
在这里插入图片描述

Lasso回归的一个重要特点是它倾向于完全消除掉最不重要特征的权重，也就是将其设为0。话句话说，Lasso会自动做特征选择，并输出一个系数模型。我可以看到l1正则后的多项式曲线更接近于二次函数。

from sklearn.linear_model import Lasso

plt.figure(figsize=(8,4))
plt.subplot(121)
plot_model(Lasso, polynomial=False, alphas=(0, 0.1, 1), random_state=42)
plt.ylabel("$y$", rotation=0, fontsize=18)
plt.subplot(122)
plot_model(Lasso, polynomial=True, alphas=(0, 10**-7, 1), tol=1, random_state=42)
plt.show()

在这里插入图片描述

from sklearn.linear_model import Lasso
lasso_reg = Lasso(alpha=0.1)
lasso_reg.fit(X, y)
lasso_reg.predict([[1.5]]) #同样的可以预测1.5这个点的值
array([1.53788174])

弹性网络

介于L2和L1之间就是Elastic回归
在这里插入图片描述

    
from sklearn.linear_model import ElasticNet
elastic_net = ElasticNet(alpha=0.1, l1_ratio=0.5, random_state=42)
elastic_net.fit(X, y)
elastic_net.predict([[1.5]])
array([1.54333232])

这么多的正则化方式，该如何取舍呢？通常来说，有正则化，哪怕是很小，也更可取。故大多数情况要避免使用纯线性回归。岭回归就是一个不错的默认选择，但是如果实际应用的特征只有少数几个，那么应该更倾向于Lasso或者Elastic，因为这两个会将无用特征的权重降为0.一般而言，Elastic会优于Lasso，因为当特征数量超过训练实例数量，又或者是几个特征强相关时，Lasso回归的表现可能非常不稳定。

早期停止法

对于梯度下降算法，还有早期停止法这一与众不同的正则化方法，就是在验证集误差达到最小的时候停止训练。

# 定义训练数据
np.random.seed(42)
m = 100
X = 6 * np.random.rand(m, 1) - 3
y = 2 + X + 0.5 * X**2 + np.random.randn(m, 1)

X_train, X_val, y_train, y_val = train_test_split(X[:50], y[:50].ravel(), test_size=0.5, random_state=10)

poly_scaler = Pipeline([
        ("poly_features", PolynomialFeatures(degree=90, include_bias=False)),
        ("std_scaler", StandardScaler()),
    ])
# 用多项式来扩展训练数据，采用90阶多项式来组合，然后标准化
X_train_poly_scaled = poly_scaler.fit_transform(X_train)
X_val_poly_scaled = poly_scaler.transform(X_val)
# 随机梯度下降算法
sgd_reg = SGDRegressor(max_iter=1,
                       tol=-np.infty,
                       penalty=None,
                       eta0=0.0005,
                       warm_start=True,
                       learning_rate="constant",
                       random_state=42)

n_epochs = 500
train_errors, val_errors = [], []
# 迭代500轮
for epoch in range(n_epochs):
    sgd_reg.fit(X_train_poly_scaled, y_train)
    y_train_predict = sgd_reg.predict(X_train_poly_scaled)
    y_val_predict = sgd_reg.predict(X_val_poly_scaled)
    train_errors.append(mean_squared_error(y_train, y_train_predict))
    val_errors.append(mean_squared_error(y_val, y_val_predict))

best_epoch = np.argmin(val_errors)
best_val_rmse = np.sqrt(val_errors[best_epoch])
# 打印文本标记
plt.annotate('Best model',
             xy=(best_epoch, best_val_rmse),
             xytext=(best_epoch, best_val_rmse + 1),
             ha="center",
             arrowprops=dict(facecolor='black', shrink=0.05),
             fontsize=16,
            )
            
best_val_rmse -= 0.03  # just to make the graph look better
plt.plot([0, n_epochs], [best_val_rmse, best_val_rmse], "k:", linewidth=2)
plt.plot(np.sqrt(val_errors), "b-", linewidth=3, label="Validation set")
plt.plot(np.sqrt(train_errors), "r--", linewidth=2, label="Training set")
plt.legend(loc="upper right", fontsize=14)
plt.title("早期停止法正则化", fontsize=14)
plt.xlabel("Epoch", fontsize=14)
plt.ylabel("RMSE", fontsize=14)
plt.show()

在这里插入图片描述

# 打印训练集最佳的迭代轮数和此时的模型
from sklearn.base import clone
sgd_reg = SGDRegressor(max_iter=1, tol=-np.infty, warm_start=True, penalty=None,
                       learning_rate="constant", eta0=0.0005, random_state=42)

minimum_val_error = float("inf")
best_epoch = None
best_model = None
for epoch in range(1000):
    sgd_reg.fit(X_train_poly_scaled, y_train)  # continues where it left off
    y_val_predict = sgd_reg.predict(X_val_poly_scaled)
    val_error = mean_squared_error(y_val, y_val_predict)
    if val_error < minimum_val_error:
        minimum_val_error = val_error
        best_epoch = epoch
        best_model = clone(sgd_reg)
best_epoch, best_model
（239,
 SGDRegressor(alpha=0.0001, average=False, early_stopping=False, epsilon=0.1,
              eta0=0.0005, fit_intercept=True, l1_ratio=0.15,
              learning_rate='constant', loss='squared_loss', max_iter=1,
              n_iter_no_change=5, penalty=None, power_t=0.25, random_state=42,
              shuffle=True, tol=-inf, validation_fraction=0.1, verbose=0,
              warm_start=True))

Vxxxx_

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
正则线性模型

目录正则线性模型岭回归套索回归弹性网络早期停止法正则线性模型减少模型过拟合的一个好办法是对模型正则化。对于多项式模型，简单办法就是降低多项式的阶数，下面将会使用Ridge回归、Lasson回归、Elastic网络三种方法来对权重进行约束。岭回归岭回归是线性回归的正则化版，通过在成本函数中添加一个等于的正则项，需要注意的是，正则项只能在训练的时候添加到损失函数中，一旦训练完成，需要使用未经正则化的性能指标来评估模型性能。执行岭回归前，必须对数据做特征缩放，因为其对于输入特征的大小非常敏感。fr
复制链接

扫一扫