Python岭回归(Ridge Regression)

最新推荐文章于 2024-07-19 16:29:11 发布

rubyw

最新推荐文章于 2024-07-19 16:29:11 发布

阅读量1.5k

点赞数 20

分类专栏：机器学习文章标签：回归数据挖掘人工智能 python 算法

本文链接：https://blog.csdn.net/rubyw/article/details/135750599

版权

机器学习专栏收录该内容

16 篇文章 1 订阅

订阅专栏

本文介绍了岭回归的基本原理，包括选择合适参数的策略，通过Python的sklearn库进行代码实现，并展示了如何使用RidgeCV选择最优岭系数，以及可视化误差与系数的关系。

摘要由CSDN通过智能技术生成

一、岭回归的原理

在这里插入图片描述

二、岭回归的一般选择原则

在这里插入图片描述

三、代码实战

# -*- coding: utf-8 -*-
"""
Created on 2024.1.22

@author: rubyw
"""

import numpy as np
from numpy import genfromtxt
from sklearn import linear_model
import matplotlib.pyplot as plt

# 读入数据
data = genfromtxt('longley.csv', delimiter=',')
print(data)

# 切分数据
x_data = data[1:, 2:]
y_data = data[1:, 1]
print(x_data)
print(y_data)

# 创建模型
# 生成50个值
alphas_to_test = np.linspace(0.001, 1)
# 创建模型，保存误差值
model = linear_model.RidgeCV(alphas=alphas_to_test, store_cv_values=True)
model.fit(x_data, y_data)

# 岭系数
print(model.alpha_)
# 误差
print(model.cv_values_.shape)

# 画图
# 岭系数跟误差的关系
plt.plot(alphas_to_test, model.cv_values_.mean(axis=0))
# 选取的岭系数值的位置
plt.plot(model.alpha_, min(model.cv_values_.mean(axis=0)),'ro')
plt.show()

model.predict(x_data[1].reshape(1, -1))