Exp1-LinearRegression

最新推荐文章于 2023-03-05 00:00:53 发布

陆离2333

最新推荐文章于 2023-03-05 00:00:53 发布

阅读量1.5k

点赞数 5

分类专栏：数据挖掘与机器学习文章标签： python 机器学习人工智能数据分析

本文链接：https://blog.csdn.net/weixin_43915303/article/details/109362422

版权

本实验详细介绍了线性回归和岭回归的实现过程，包括单变量和多变量线性回归的梯度下降法、闭式解，以及岭回归的闭式解。通过数据可视化和损失函数计算，帮助理解模型在数据上的工作原理。

摘要由CSDN通过智能技术生成

实验1：线性回归及岭回归

在本实验中，你将实现线性回归及岭回归并了解其在数据上的工作原理。

本次实验需要用到的数据集包括：

评分标准如下：

在该部分实验中，将实现单变量线性回归并用来预测餐车的利润。

假设你是一家餐厅的领导，正在考虑在不同的城市开设新的分店。该连锁店已经在不同的城市有了餐车，并且你能够获得每个城市的人口和利润数据。

现在需要使用这些数据来帮助你选择下一个被扩展的城市。

文件ex1data1.txt包含线性回归问题的数据集。第一列数据对应城市人口，第二列数据对应那座城市的餐车的利润。利润为负时表示亏损。

在开始进入实验之前，对数据进行可视化通常很有用。对于该数据集，可以使用散点图进行可视化，因为它只有两个属性（人口、利润）。

# 引入所需要的库文件
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import os

%matplotlib inline

# 数据存储路径
path = 'ex1data1.txt'

# 读入相应的数据文件
data = pd.read_csv(path, header=None,names=['Population','Profit'])

#查看数据的前五条
data.head(5)

# 数据可视化 
data.plot(kind='scatter', x='Population', y='Profit',c='red', figsize=(9,6))

在这里插入图片描述

在该部分中，将使用梯度下降来选择合适的线性回归参数 $\mathbf{w}$ 用以拟合给定数据集。

说明：为编写方便，偏置项 $b$ 可被作为权重向量 $\mathbf{w}$ 的第一个分量 $w_0$ 。

线性回归的目的是最小化目标函数：

$E(\mathbf{w}) = \frac{1}{2m} \sum_{i=1}^m \left( \mathbf{w}^T\mathbf{x}_i - y_i\right)^2$

其中 $\mathbf{w}$ 为权重参数。上述目标函数也可写成如下矩阵形式：

$E(\mathbf{w}) = \frac{1}{2m} \|\mathbf{X}\mathbf{w}-\mathbf{y}\|_2^2$

关注

专栏目录