sklearn 中的线性回归、岭回归、Lasso回归参数配置及示例

本文介绍了sklearn中线性回归、岭回归和Lasso回归的重要参数、属性、方法及示例。线性回归的coef_表示特征相关性,岭回归和Lasso回归通过正则项进行模型复杂度控制,Lasso回归还能实现特征选择。参数如fit_intercept、normalize、alpha等对模型性能有显著影响。
摘要由CSDN通过智能技术生成


本文主要讲一些sklearn中回归模型的使用,如果需要了解相关理论,请查阅: 【线性回归】面向新手的基础知识

线性回归

引入

from sklearn.linear_model import LinearRegression
# 默认参数如下:
LinearRegression(fit_intercept=True,normalize=False,copy_X=True,n_jobs=1)

重要参数

1,fit_intercept

bool类型,默认为True,表示是否计算截距(即 y = wx + b 中的 b ),推荐设置为True

2,normalize

bool类型,默认为False,表示是否对各个特征进行标准化(默认方法是:减去均值并除以 l 2 l_2 l2 范数),推荐设置为True。如果设置为False,则建议在输入模型之前,手动进行标准化。

标准化的好处:

  1. 加速收敛

  2. 提升精度

注意:fit_intercept 设置为 False 时,将忽略此参数。

3,n_jobs

数值型,默认值为None。表示使用多少个处理器进行运算,当模型有多个回归目标( _targets > 1 )时,加速效果比较明显。推荐设置为 -1 ,此时会调用所有处理器。

重要属性

1,coef_

对应 X 各个特征的系数,绝对值越接近1,表示相关性越强。

2,intercept_

intercept_ 表示模型学习到的截距值。

注意:属性后面有下划线 _

重要方法

1,fit(X, y) ,训练模型

2,predict(X),使用模型进行预测

3,score(X, y),返回 R 2 R^2 R2 值 (确定系数) ,越接近1说明拟合的效果越好。

例子

import matplotlib.pyplot as plt
import numpy as np
from sklearn import datasets, linear_model
from sklearn.metrics import mean_squared_error, r2_score

# 载入糖尿病数据集
diabetes_X, diabetes_y = datasets.load_diabetes(return_X_y=True)

# 只从中抽取一个特征
diabetes_X = diabetes_X[:, np.newaxis, 2]

# 划分训练集与测试集
diabetes_X_train = diabetes_X[:-20]
diabetes_y_train = diabetes_y[:-20]
diabetes_X_test = diabetes_X[-20:]
diabetes_y_test = diabetes_y[-20:]

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值