datawhale第23期集成学习基本线性回归算法的掌握task04

回归模型用于预测分析和因果关系研究,如道路交通事故与鲁莽驾驶的关系。本文聚焦于线性回归,特别是使用sklearn库的LinearRegression接口。介绍了fit_intercept和normalize参数,并通过加利福尼亚房屋数据集进行实操,包括数据导入、模型训练、评估及预测。实操中展示了训练集和测试集的评分,以及模型的系数和截距。
摘要由CSDN通过智能技术生成

概述

  • 回归模型是一种预测性的建模技术,它研究的是因变量(目标)和自变量(预测器)之间的关系。这种技术通常用于预测分析,时间序列模型以及发现变量之间的因果关系。例如,司机的鲁莽驾驶与道路交通事故数量之间的关系,最好的研究方法就是回归。

1、线性回归Sklearn API接口:

  • sklearn.linear_model.LinearRegression:
    功能: 普通最小二乘线性回归。
    参数: fit_intercept: 是否拟合截距.
    normalize:bool, default=False 如果为True,则将在回归之前通过减去均值并除以l2-范数来对回归变量X进行归一化。
    属性Attributes:
    coef_: 线性回归问题的估计系数。
    intercept_: 拟合的截距

2、线性回归实操

  • 了解完线性回归的的概述和接口,接下来,我们来实操吧。 以加尼福尼亚数据为例

#导包
from sklearn.datasets import fetch_california_housing from sklearn.linear_model import LinearRegression
house = fetch_california_housing()
X = pd.DataFrame(house.data,columns=house.feature_names)
在这里插入图片描述
ex = “”"
特征解释
MedInc:该街区住户的收入中位数
HouseAge:该街区房屋使用年代的中位数
AveRooms:该街区平均的房间数目
AveBedrms:该街区平均的卧室数目
Population:街区人口
AveOccup:平均入住率
Latitude:街区的纬度
Longitude:街区的经度
“”";
#拆分训练集和测试集
y = house.target
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(
X, y, test_size=0.3, random_state=1)
#建模
lr = LinearRegression()
lr.fit(X_train,y_train)
#评估
训练集评分
lr.score(X_train, y_train)
测试集评分
lr.score(X_test, y_test)
#输出系数和截距
lr.coef_
lr.intercept_
在这里插入图片描述
在这里插入图片描述
#测试预测结果
y_pred = lr.predict(X_test)
y_pred
在这里插入图片描述

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值