第二天：单变量线性回归

Conan х

于 2024-07-31 10:54:12 发布

阅读量273

点赞数 11

分类专栏：吴恩达《机器学习》作业班文章标签：机器学习人工智能 python

本文链接：https://blog.csdn.net/weixin_54856108/article/details/140817083

版权

吴恩达《机器学习》作业班专栏收录该内容

12 篇文章 0 订阅

订阅专栏

引言

在机器学习的世界里，单变量线性回归是一块敲门砖，它简单却强大，能够帮助我们理解数据之间的线性关系。本篇文章将带你一步步了解单变量线性回归的基本概念、实现方法和应用场景。

什么是单变量线性回归？

单变量线性回归是一种基本的预测模型，它通过分析一个自变量（X）和一个因变量（Y）之间的线性关系，来预测未来的值。这种关系可以用以下的线性方程表示： y=β0+β1xy=β0+β1x

线性关系的数学解释

线性关系意味着，当我们在坐标轴上绘制数据点时，这些点会近似地落在一条直线上。这条直线的斜率（β1β1）表示自变量每变化一个单位，因变量预期的变化量。截距（β0β0）则是当自变量为0时，因变量的预期值。

如何实现单变量线性回归？

步骤1：收集数据

首先，我们需要收集一些数据点。例如，我们可能有一个数据集，包含不同房屋的大小（以平方米为单位）和相应的价格。

步骤2：绘制散点图

使用Python的matplotlib库，我们可以绘制一个散点图来可视化数据点：

import matplotlib.pyplot as plt

# 假设的数据点
sizes = [50, 70, 100, 120, 150]
prices = [100000, 140000, 200000, 250000, 300000]

plt.scatter(sizes, prices)
plt.xlabel('House Size (sq. ft.)')
plt.ylabel('Price ($)')
plt.title('House Size vs. Price')
plt.show()

步骤3：选择最佳拟合线

最佳拟合线是通过最小化所有数据点到直线的垂直距离（即残差平方和）来确定的。这可以通过scikit-learn库中的LinearRegression模型来实现：

from sklearn.linear_model import LinearRegression
import numpy as np

# 转换数据为适合模型的格式
X = np.array(sizes).reshape(-1, 1)
y = np.array(prices)

# 创建线性回归模型并拟合数据
model = LinearRegression()
model.fit(X, y)

# 获取模型参数
intercept = model.intercept_
slope = model.coef_[0]

# 绘制最佳拟合线
plt.plot(sizes, model.predict(X), color='red')
plt.show()

步骤4：评估模型

我们可以通过计算均方误差（MSE）或均方根误差（RMSE）来评估模型的性能：

from sklearn.metrics import mean_squared_error

# 真实值和预测值
y_pred = model.predict(X)
mse = mean_squared_error(y, y_pred)
rmse = np.sqrt(mse)

print(f'Mean Squared Error: {mse}')
print(f'Root Mean Squared Error: {rmse}')

单变量线性回归的应用

单变量线性回归虽然简单，但可以应用于多种场景，例如：

房地产定价：预测不同大小房屋的价格。
金融市场分析：估计股票价格与市场因素的关系。
教育研究：分析学生的成绩与学习时间的关系。

总结

单变量线性回归是理解机器学习基本概念的一个很好的起点。通过这个模型，我们可以开始探索数据之间的关系，并为更复杂的机器学习算法打下基础。

Conan х

关注

11
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
第二天：单变量线性回归

单变量线性回归是一种基本的预测模型，它通过分析一个自变量（X）和一个因变量（Y）之间的线性关系，来预测未来的值。这种关系可以用以下的线性方程表示： y=β0+β1xy=β0+β1x单变量线性回归是理解机器学习基本概念的一个很好的起点。通过这个模型，我们可以开始探索数据之间的关系，并为更复杂的机器学习算法打下基础。
复制链接

扫一扫