【ML】基于机器学习的房价预测研究(系列3:线性回归模型)

该博客介绍了基于机器学习的房价预测研究系列的第三部分,主要讲解了使用线性回归模型进行建模、训练、测试和评估。文章详细阐述了线性回归模型的构建,展示了训练和测试代码,并通过折线图和散点图对模型预测结果进行了可视化。
摘要由CSDN通过智能技术生成

写在前面:
首先感谢兄弟们的关注和订阅,让我有创作的动力,在创作过程我会尽最大能力,保证作品的质量,如果有问题,可以私信我,让我们携手共进,共创辉煌。
(专栏订阅用户订阅专栏后免费提供数据集,代码贴在博文中,超级VIP用户不在服务范围之内,不想订阅专栏的兄弟们可以私信我详聊)

本次实战的项目是:基于机器学习的房价预测研究(附完整代码和数据集),系列3:线性回归模型

数据的获取、读取、预处理、划分等请见这篇文章:

【ML】基于机器学习的房价预测研究(系列1:数据集)
【ML】基于机器学习的房价预测研究(系列2:XGBoost模型)

接着上篇文章,我们进入建模和评估教程。

6.建模

6.1 线性回归模型

定义模型:


                
  • 2
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
好的,以下是一个基于机器学习线性回归模型的案例,包含多元线性回归和PCA降维: ## 数据集 我们将使用一个来自UCI Machine Learning Repository的数据集,该数据集包含了波士顿地区不同位置房屋的房价和相关信息。数据集中包含13个特征变量和1个目标变量(房价)。这个数据集是一个经典的回归问题,我们将使用多元线性回归模型来预测房价。 ## 数据预处理 首先,我们需要将数据集读入到程序中,并对数据进行预处理。我们使用pandas库来读取和处理数据: ```python import pandas as pd # 读取数据 df = pd.read_csv('https://archive.ics.uci.edu/ml/machine-learning-databases/housing/housing.data', header=None, sep='\s+') df.columns = ['CRIM', 'ZN', 'INDUS', 'CHAS', 'NOX', 'RM', 'AGE', 'DIS', 'RAD', 'TAX', 'PTRATIO', 'B', 'LSTAT', 'MEDV'] # 查看数据 print(df.head()) ``` 我们可以看到,数据集中的每个特征都有不同的取值范围和单位,因此我们需要对数据进行标准化处理。我们使用sklearn库中的StandardScaler类来进行标准化处理: ```python from sklearn.preprocessing import StandardScaler X = df.iloc[:, :-1].values y = df['MEDV'].values # 标准化处理 sc = StandardScaler() X = sc.fit_transform(X) y = sc.fit_transform(y.reshape(-1, 1)) ``` ## 多元线性回归模型 接下来,我们使用多元线性回归模型来训练数据集,并预测房价。我们使用sklearn库中的LinearRegression类来实现多元线性回归模型: ```python from sklearn.linear_model import LinearRegression # 训练模型 regressor = LinearRegression() regressor.fit(X, y) # 预测房价 X_test = sc.transform([[0.03237, 0.0, 2.18, 0, 0.458, 6.998, 45.8, 6.0622, 3, 222, 18.7, 394.63, 2.94]]) y_pred = regressor.predict(X_test) # 将预测结果转换为原始值 y_pred = sc.inverse_transform(y_pred) print('预测房价为:{:.2f}万美元'.format(y_pred[0][0])) ``` ## PCA降维 接下来,我们将使用PCA降维来简化特征空间并提高模型训练的效率。我们使用sklearn库中的PCA类来实现PCA降维: ```python from sklearn.decomposition import PCA # PCA降维 pca = PCA(n_components=2) X_pca = pca.fit_transform(X) # 训练模型 regressor_pca = LinearRegression() regressor_pca.fit(X_pca, y) # 预测房价 X_test_pca = pca.transform([[0.03237, 0.0, 2.18, 0, 0.458, 6.998, 45.8, 6.0622, 3, 222, 18.7, 394.63, 2.94]]) y_pred_pca = regressor_pca.predict(X_test_pca) # 将预测结果转换为原始值 y_pred_pca = sc.inverse_transform(y_pred_pca) print('预测房价为:{:.2f}万美元'.format(y_pred_pca[0][0])) ``` ## 结果分析 接下来,我们将比较使用多元线性回归模型和PCA降维后的多元线性回归模型的预测结果: ```python print('多元线性回归模型预测房价为:{:.2f}万美元'.format(y_pred[0][0])) print('PCA降维后的多元线性回归模型预测房价为:{:.2f}万美元'.format(y_pred_pca[0][0])) ``` 我们可以看到,使用PCA降维后的多元线性回归模型的预测结果与使用多元线性回归模型的预测结果相同,但是PCA降维后的特征空间更简化,模型训练的效率更高。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

机器不学习我学习

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值