基于python实现的线性回归基础

@基于python实现的基本线性回归(高中数学版)

由于毕设的原因,在这里做一些笔记,主要是记录一下pandas和list以及基本计算求得线性回归的系数

数据集来源

数据集是来自于科赛的数据,附下载链接(需要一个github账号才能下载)
https://www.kesci.com/home/dataset/59e715b76d213335f38d4507
下载好了以后的数据集就是这样的
在这里插入图片描述
我这次采用的是车辆的数据集进行基本的计算,车辆的速度与行驶距离之间的关系是否能用基本的线性回归方式进行拟合呢?那么我们首先要求得之间的相关系数才能下结论,但是最起码我掌握了一种基本的预测方法。
在这里插入图片描述

一些基本知识

从下图可以看到我们要求的是系数b,差值a以及我们对应的x,y的平均数
在这里插入图片描述

  • 用pandas读取文件
  • 合并文件中的两个X,Y
  • 求出x,y的平均数
  • 带入求得方差
  • 带入求得b
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
线性回归是一种常见的机器学习算法,用于建立一个线性模型来预测连续型的输出变量。下面是基于Python实现线性回归的步骤: 1. 导入所需的库: ``` import numpy as np import pandas as pd from sklearn.linear_model import LinearRegression from sklearn.model_selection import train_test_split from sklearn.metrics import mean_squared_error ``` 2. 准备数据: 首先,需要准备包含特征和目标变量的数据集。特征通常表示为一个矩阵,而目标变量通常表示为一个向量。可以使用NumPy或Pandas库来加载和处理数据。 3. 划分数据集: 将数据集划分为训练集和测试集,以便评估模型的性能。可以使用`train_test_split`函数来实现。 4. 创建线性回归模型: 使用`LinearRegression`类创建一个线性回归模型对象。 5. 拟合模型: 使用训练集的特征和目标变量来拟合线性回归模型。可以使用`fit`方法来实现。 6. 进行预测: 使用测试集的特征进行预测,并将预测结果与真实值进行比较。 7. 评估模型: 使用评估指标(如均方误差)来评估模型的性能。可以使用`mean_squared_error`函数来计算均方误差。 下面是一个示例代码: ```python # 导入所需的库 import numpy as np import pandas as pd from sklearn.linear_model import LinearRegression from sklearn.model_selection import train_test_split from sklearn.metrics import mean_squared_error # 准备数据 data = pd.read_csv('data.csv') # 假设数据保存在data.csv文件中 X = data[['feature1', 'feature2']] # 特征变量 y = data['target'] # 目标变量 # 划分数据集 X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42) # 创建线性回归模型 model = LinearRegression() # 拟合模型 model.fit(X_train, y_train) # 进行预测 y_pred = model.predict(X_test) # 评估模型 mse = mean_squared_error(y_test, y_pred) print('均方误差:', mse) ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值