sklearn机器学习 线性回归 以糖尿病数据为例

在sklearn中提供一些数据包可以用来进行简单的机器学习,今天我们以糖尿病数据为例,来进行线性回归分析

1.导所需要的包

import numpy as np
from sklearn.datasets import load_diabetes
from sklearn.utils import shuffle
from sklearn.model_selection import train_test_split
import matplotlib.pyplot as plt
from sklearn import linear_model
from sklearn.metrics import mean_squared_error, r2_score

2.导入数据,对数据集进行划分

在sklearn中自带一些数据集供用户使用,例如其中diabetes就是部分糖尿病人的数据,数据中存在的键值有dict_keys(['data', 'target', 'frame', 'DESCR', 'feature_names', 'data_filename', 'target_filename'])

这些键解释分别是

  • data:特征值 (数组)

  • target:标签值 (数组)

  • target_names:标签 (列表)

  • DESCR:数据集描述

  • feature_names:特征 (列表)

  • filename:iris.csv 文件路径

下面我们导入数据集并进行划分 

diabetes = load_diabetes()
data = diabetes.data
target = diabetes.target
X, y = shuffle(data, target, random_state=13)
X= X.astype(np.float32)
y = y.reshape((-1, 1))
X_train,X_test, y_train, y_test = train_test_split(X, y, test_size=0.25, random_state=42)
print(X_train.shape, y_train.shape, X_test.shape, y_test.shape)

3.建立数据模型并训练数据

reg = linear_model.LinearRegression()
reg.fit(X_train, y_train)

4.对模型进行评估

y_pred = reg.predict(X_test)
print('Coefficients:  n',reg.coef_)
print("sMean squared error: %.2f"
      %mean_squared_error(y_test, y_pred)) 
print('Variance score: %.2f'%r2_score(y_test, y_pred))
print(r2_score(y_test, y_pred))
plt.scatter(range(X_test.shape[0]), y_test, color='red')
plt.plot(range(X_test.shape[0]), y_pred, color='green', linewidth=3)
plt.xticks(())
plt.yticks(())
plt.show();

  • 6
    点赞
  • 34
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

幽梦开运.

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值