监督学习之非线性回归

最新推荐文章于 2023-05-03 08:36:23 发布

归去来兮的百宝箱

最新推荐文章于 2023-05-03 08:36:23 发布

阅读量94

点赞数

分类专栏：机器学习基础文章标签：回归学习机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_53475159/article/details/130175176

版权

机器学习基础专栏收录该内容

7 篇文章 0 订阅

订阅专栏

目录

实验目的

实验内容与要求

实验程序与结果

实验结果分析

实验问题解答与体会

实验目的

1.学习非线性回归模型的基本原理和假设。

2.使用Python中的Scikit-Learn库来实现非线性回归模型。

3.使用非线性回归模型来进行预测。

实验内容与要求

与房价密切相关的除了单位的房价，还有房屋的尺寸。我们可以根据已知的房屋成交价和房屋的尺寸进行线性回归，继而可以对已知房屋尺寸，而未知房屋成交价格的实例进行成交价格的预测。对于给出的数据集，请对对房屋成交信息建立非线性回归方程，并依据回归方程对房屋价格进行预测。

实验程序与结果

import pandas as pd

import numpy as np

import matplotlib

import random

from matplotlib import pyplot as plt

from sklearn.preprocessing import PolynomialFeatures

from sklearn.linear_model import LinearRegression

#2.加载训练数据，建立回归方程

# 读取数据集,建立datasets_X和datasets_Y用来存储数据中的房屋尺寸和房屋成交价格。

datasets_X = []

datasets_Y = []

#打开数据集所在文件prices.txt，读取数据。

fr = open('prices.txt','r')

#一次读取整个文件。

lines = fr.readlines()

# 读取数据集

#逐行进行操作，循环遍历所有数据

for line in lines:

# 去除数据文件中的逗号

items = line.strip().split(',')

# 将读取的数据转换为int型，并分别写入datasets_X和datasets_Y。

datasets_X.append(int(items[0]))

datasets_Y.append(int(items[1]))

#求得datasets_X的长度，即为数据的总数。

length = len(datasets_X)

#将datasets_X转化为数组，并变为二维，以符合线性回归拟合函数输入参数要求。

datasets_X = np.array(datasets_X).reshape([length,1])

#将datasets_Y转化为数组

datasets_Y = np.array(datasets_Y)

# 以数据datasets_X的最大值和最小值为范围，建立等差数列，方便后续画图。

minX = min(datasets_X)

maxX = max(datasets_X)

X = np.arange(minX,maxX).reshape([-1,1])

# 线性回归

clf1 = LinearRegression()

clf1.fit(datasets_X, datasets_Y)

y_l = clf1.predict(X) # 线性回归预测值

# 非线性回归

ployfeat = PolynomialFeatures(degree=3) # 根据degree的值转换为相应的多项式（非线性回归）

x_p = ployfeat.fit_transform(datasets_X)

print(datasets_X)

print(x_p)

clf2 = LinearRegression()

clf2.fit(x_p, datasets_Y)

#画图

print(clf2.intercept_)

print(clf2.coef_)

font={"family":"FangSong",'size':12}

matplotlib.rc("font",**font)

plt.figure(figsize = (12,6))

plt.scatter(datasets_X,datasets_Y,label="real value")

plt.plot(X,y_l,label = "线性回归")

plt.plot(X,clf2.predict(ployfeat.fit_transform(X)),label="非线性回归")

plt.legend()

plt.show()

print(clf2.intercept_)

print(clf2.coef_)

49.8601106194547

[ 0.00000000e+00 1.95441885e-01 -4.26246389e-05 7.79675380e-09]

实验结果分析

以下为核心代码：

# 线性回归

clf1 = LinearRegression()

clf1.fit(datasets_X, datasets_Y)

y_l = clf1.predict(X) # 线性回归预测值

# 非线性回归

ployfeat = PolynomialFeatures(degree=3) # 根据degree的值转换为相应的多项式（非线性回归）

x_p = ployfeat.fit_transform(datasets_X)

print(datasets_X)

print(x_p)

clf2 = LinearRegression()

clf2.fit(x_p, datasets_Y)

在代码执行的过程中，线性回归可以直接调用LinearRegression和fit函数，然而非线性回归首先需要进行多项式的特征提取，采用fit_transform函数，然后进行同线性回归一致的操作。需要注意的是，在画图过程中，我们需要注意非线性回归的y值需要在多项式的特征提取X值才能正确作图。

print(clf2.intercept_)

print(clf2.coef_)

font={"family":"FangSong",'size':12}

matplotlib.rc("font",**font)

plt.figure(figsize = (12,6))

plt.scatter(datasets_X,datasets_Y,label="real value")

plt.plot(X,y_l,label = "线性回归")

plt.plot(X,clf2.predict(ployfeat.fit_transform(X)),label="非线性回归")

plt.legend()

plt.show()

查看三阶线性回归拟合的系数值，在合理范围之内。

print(clf2.intercept_)

print(clf2.coef_)

49.8601106194547

[ 0.00000000e+00 1.95441885e-01 -4.26246389e-05 7.79675380e-09]

通过观察线性回归与非线性回归的拟合效果，发现非线性回归的拟合效果更好。

实验问题解答与体会

作为一种经典的监督学习方法，非线性回归模型比线性回归算法在实际问题中具有广泛的应用。通过本次实验，我深刻地体会到了非线性回归模型的建模过程和应用方法。

在实验过程中，我学会了如何使用Scikit-Learn库中的线性回归模型来拟合数据，并且构建了非线性回归模型，并了解了模型的训练和评估方法。同时，我也掌握了如何使用matplotlib库来可视化数据和模型拟合结果，通过直观的图形展示，更好地理解了数据和模型之间的关系。

归去来兮的百宝箱

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
监督学习之非线性回归

监督学习之非线性回归
复制链接

扫一扫

专栏目录

归去来兮的百宝箱 CSDN认证博客专家 CSDN认证企业博客

码龄4年

77: 原创

111万+: 周排名

16万+: 总排名

3万+: 访问

: 等级

828: 积分

25: 粉丝

43: 获赞

6: 评论

157: 收藏

私信

关注

热门文章

分类专栏

最新评论

FIR数字滤波器设计——频率抽样法
weixin_42901598: 请问为什么后面还要加窗函数呢
数据存储-软盘
温夏wx: 怎么感觉总bit那要乘两个1024
递增的三元子序列
白话机器学习: 文章写得专业、深入、详细，收藏啦
RDOQ过程浅析（一文说清楚）
CSDN-Ada助手: 非常感谢作者的分享，这篇博客对我来说真的很有帮助。恭喜你能够深入浅出地解释RDOQ过程，让我们更好地理解这个概念。希望作者能够继续创作，分享更多有趣的内容，比如对于实践中的应用案例或是对于不同算法的对比分析。期待着您的下一篇博客！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3，我们会奖励持续创作和学习的博主，请看：https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply3
数学建模学习（一）
CSDN-Ada助手: 恭喜您写出了第四篇博客，标题为“数学建模学习（一）”！这篇文章非常有价值，让我对数学建模有了更深入的理解。我期待您的下一篇博客，希望您能够分享更多实用的数学建模技巧和经验。再次感谢您的分享！ CSDN 会根据你创作的前四篇博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply4 看奖励名单。

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。