02_基于线性回归预测糖尿病

基于线性回归预测糖尿病

1、实验描述

  • 使用Python编程,利用diabetes
    dataset,一个糖尿病数据集,主要包括442行数据,10个属性值,分别是:Age(年龄)、性别(Sex)、Body
    mass index(体质指数)、Average Blood
    Pressure(平均血压)、S1~S6一年后疾病级数指标。Target为一年后患疾病的定量指标。首先将数据集划分为训练集和测试集,创建线性回归模型,然后训练数据集,得到每个特征下的参数。绘图表示出真实值和预测值之间的对比。

  • 实验时长:35分钟

  • 主要步骤:

    • 数据集的划分

    • 创建普通线性回归模型

    • 将训练数据输入学习模型中进行训练

    • 将测试数据输入模型,获得预测结果

    • 绘图进行效果评估

2、实验环境

  • 系统版本:CentOS7

  • Python版本:3.6.6

  • Matplotlib版本:2.2.2

  • Anaconda版本:4.3.30

  • Numpy版本:1.13.1

  • scikit-learn版本:0.18.2

3、相关技能

  • Python编程

  • 线性回归模型

4、相关知识点

  • LinearRegression

    • 是scikit-learn提供的线性回归模型,其原型为:

    • class sklearn.linear_model.LinearRegression(fit_intercept=True,
      normalize=False, copy_X=True, n_jobs=1)

    • 导入:from sklearn.linear_model import LinearRegression

    • 参数

  • (1)fit_intercept :
    一个布尔值,指定是否需要计算b值。如果为False,那么不计算b值。

  • (2)normalize : 一个布尔值。如果为True,那么训练样本会在回归之前被归一化。

  • (3)copy_X : 一个布尔值。如果为True,则会被复制。

  • (4)n_jobs :
    一个正数。任务并行时指定的CPU数量。如果为-1则使用所有可用的CPU。

    • 属性
  • (1)coef_ : 权重向量。

  • (2)intercept_ : 截距b值。

    • 方法
  • (1)fit(X,y) : 训练模型。

  • (2)predict(X) : 用模型预测,返回预测值。

  • (3)score(X,y) : 返回性能得分。设预测集为

在这里插入图片描述

>   ,真实值为

在这里插入图片描述

>   ,真实值的均值为

在这里插入图片描述

>   ,预测值为

在这里插入图片描述

>   ,则: 

在这里插入图片描述

  • 线性回归

    • 在统计学中,线性回归(Linear
      Regression)是利用称为线性回归方程的最小平方函数对一个或多个自变量和因变量之间关系进行建模的一种回归分析。这种函数是一个或多个称为回归系数的模型参数的线性组合。

    • 回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析。如果回归分析中包括两个或两个以上的自变量,且因变量和自变量之间是线性关系,则称为多元线性回归分析。

    • 建立函数模型
      在这里插入图片描述

  • 训练数据

在这里插入图片描述

  • 采用矩阵表示

在这里插入图片描述

  • 最小二乘法

  • 我们有很多的给定点,这时候我们需要找出一条线去拟合它,那么我先假设这个线的方程,然后把数据点代入假设的方程得到观测值,求使得实际值与观测值相减的平方和最小的参数。对变量求偏导联立便可求。

  • 1
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

JTZ001

你的鼓励是我创作的最大动力?

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值