L2正则化-岭回归-示例（sklearn实现）

最新推荐文章于 2024-04-25 15:44:35 发布

蒋含竹

最新推荐文章于 2024-04-25 15:44:35 发布

阅读量1.5k

点赞数

分类专栏： Python MachineLearning # Sklearn 文章标签：机器学习 MachineLearning 岭回归 sklearn 交叉验证

本文链接：https://blog.csdn.net/alionsss/article/details/87907478

版权

MachineLearning 同时被 3 个专栏收录

42 篇文章 7 订阅

订阅专栏

Python

39 篇文章 2 订阅

订阅专栏

Sklearn

13 篇文章 0 订阅

订阅专栏

文章目录

岭回归-示例（sklearn实现）

岭回归-示例（sklearn实现）

1. 导包

import numpy as np
import matplotlib.pyplot as plt
from sklearn import linear_model

2. 原始数据生成与展示

# 第一列为标签值，其他列为特征
data = [[83.0, 234.289, 235.6, 159.0, 107.608, 1947., 60.323],
        [88.5, 259.426, 232.5, 145.6, 108.632, 1948., 61.122],
        [88.2, 258.054, 368.2, 161.6, 109.773, 1949., 60.171],
        [89.5, 284.599, 335.1, 165.0, 110.929, 1950., 61.187],
        [96.2, 328.975, 209.9, 309.9, 112.075, 1951., 63.221],
        [98.1, 346.999, 193.2, 359.4, 113.27, 1952., 63.639],
        [99.0, 365.385, 187., 354.7, 115.094, 1953., 64.989],
        [100.0, 363.112, 357.8, 335.0, 116.219, 1954., 63.761],
        [101.2, 397.469, 290.4, 304.8, 117.388, 1955., 66.019],
        [104.6, 419.18, 282.2, 285.7, 118.734, 1956., 67.857],
        [108.4, 442.769, 293.6, 279.8, 120.445, 1957., 68.169],
        [110.8, 444.546, 468.1, 263.7, 121.95, 1958., 66.513],
        [112.6, 482.704, 381.3, 255.2, 123.366, 1959., 68.655],
        [114.2, 502.601, 393.1, 251.4, 125.368, 1960., 69.564],
        [115.7, 518.173, 480.6, 257.2, 127.852, 1961., 69.331],
        [116.9, 554.894, 400.7, 282.7, 130.081, 1962., 70.551]]
data = np.array(data)
x_data = data[:, 1:]
y_data = data[:, 0]
print(x_data)
print(y_data)

3. 岭回归模型

# 创建模型，开始训练

# 先随便给一个alpha系数
alpha = 0.5

# 岭回归模型
model = linear_model.Ridge(alpha)
model.fit(x_data, y_data)

# 返回模型的估计系数
print(model.coef_)
# 评分
model.score(x_data,y_data)

4. 岭回归+交叉验证的模型

4.1 创建模型，开始训练

# 创建模型，开始训练

# 生成50个alpha系数
alphas = np.linspace(0.001, 1, 50)

# 岭回归+交叉验证的模型
cv_model = linear_model.RidgeCV(alphas, store_cv_values=True)
cv_model.fit(x_data, y_data)

# 最佳的alpha
best_alpha = cv_model.alpha_
print(best_alpha)
# 交叉验证的结果
print(cv_model.cv_values_)
print(cv_model.cv_values_.shape)
# 结果中(16, 50) 指数据被拆分为16份，做了16次训练和验证，每次训练集15份、验证集1份，每次分别使用了50个alpha值做训练

4.2 结果展示

# 画针对所有的alphas值计算出的损失值
plt.plot(alphas, cv_model.cv_values_.mean(axis=0))
# 画最佳点
min_cost = min(cv_model.cv_values_.mean(axis=0))
plt.plot(best_alpha, min_cost, "rx")

plt.xlabel('alpha')
plt.ylabel('cost')
plt.show()

岭回归+交叉验证结果展示图

4.3. 预测

# 进行预测
test_data = x_data[1, np.newaxis]
model.predict(test_data)

蒋含竹

关注

0
点赞
踩
15

收藏

觉得还不错? 一键收藏
0
评论
L2正则化-岭回归-示例（sklearn实现）

文章目录岭回归-示例（sklearn实现）1. 导包2. 原始数据生成与展示3. 岭回归模型4. 岭回归+交叉验证的模型4.1 创建模型，开始训练4.2 结果展示4.3. 预测岭回归-示例（sklearn实现）1. 导包import numpy as npimport matplotlib.pyplot as pltfrom numpy import genfromtxtfrom sk...
复制链接

扫一扫