第八章 变量选择与正则化 - 糖尿病人数据集

数据集介绍
在这里插入图片描述

from sklearn import datasets

diabetes = datasets.load_diabetes()  
pd.DataFrame(diabetes.target).head()

在这里插入图片描述

pd.DataFrame(diabetes.data).head()

在这里插入图片描述

diabetes.feature_names

在这里插入图片描述

print(diabetes.DESCR)

在这里插入图片描述

数据调整
在这里插入图片描述

0 载入库&加载数据

import numpy as np
import pandas as pd	
from sklearn.linear_model import Lasso, Ridge, ElasticNet

#导入数据
df = pd.read_csv('Regression/Regression8/diabetes.csv')
features = list(df.columns)
features.remove('y')
labels = ['y']

df.sample(n=5)

在这里插入图片描述

df.info()

在这里插入图片描述

1 用lasso求解

lamb = 0.5 #参数
lasso_reg = Lasso(alpha=lamb)
#对10个原始自变量做回归
lasso_reg.fit(df[features[1:11]], df[labels])

print('截距\n', lasso_reg.intercept_)
print('自变量系数\n', lasso_reg.coef_)

在这里插入图片描述

  1. 仅4个变量不为0
  2. 稀疏性非常强
  3. 变量筛选效果好

2 岭回归

lamb = 0.1 #参数
Ridge_reg = Ridge(alpha=lamb)
Ridge_reg.fit(df[features[1:11]], df[labels])

print('截距\n', Ridge_reg.intercept_)
print('自变量系数\n', Ridge_reg.coef_)

在这里插入图片描述

  1. 全部为非0项
  2. 只具有压缩功能
  3. 不具有变量选择功能

3 引入全部特征

lamb = 0.1
lasso_reg2 = Lasso(alpha=lamb)
lasso_reg2.fit(df[features], df[labels])

print('截距\n', lasso_reg2.intercept_)
print('自变量系数\n', lasso_reg2.coef_)

在这里插入图片描述

  1. 非0元个数21
  2. 0元个数43
  3. 大部分变量系数为0
  4. 一次项非0元较多
  5. 二次项非0元较少

求numpy.ndarray非0个数

4 弹性网络方法

lamb=0.1
ElasticNet_reg = ElasticNet(alpha=lamb, l1_ratio=0.95)
ElasticNet_reg.fit(df[features], df[labels])

print('截距\n', ElasticNet_reg.intercept_)
print('自变量系数\n', ElasticNet_reg.coef_.T)

在这里插入图片描述

  1. 非0元个数38
  2. 0元个数26
  3. 非0元素个数较为折中

5 超参数选择

在这里插入图片描述

from sklearn.linear_model import LassoCV,RidgeCV,ElasticNetCV

lasso_reg = LassoCV(cv=20).fit(df[features], df[labels])    
print('超参数\n', lasso_reg.alpha_)

在这里插入图片描述

  • 4
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值