多项式回归

本文介绍了如何使用多项式函数对非线性数据进行拟合,如房价模型中通过添加占据面积的平方和立方作为特征。同时,借助Scikit-learn库的强大功能,展示了在机器学习中的实际应用和特征工程技巧。
摘要由CSDN通过智能技术生成

定义:使用多项式函数来拟合数据点,以预测因变量和自变量之间的关系。

基本形式如下:

f_{\vec{w},b}(x)= w_0 + w_1x + w_2x^2 + ... + w_nx^n +b

理解:

在了解了线性回归模型之后,我们会意识到数据集上的点有时使用曲线拟合效果会更好。我们可以选择使用多项式曲线进行拟合。

还是以房价的模型为例,假设数据集如下图中的点阵所示:我们提取的特征为占地大小x,则将大小的平方x^{2}设为第二个特征,大小的立方x^{3}设为第三个特征可以得到下图中框出的特征函数。当然,我们也可以选择使用平方根的方式。

Scikit-learn库

Scikit-learn是一个用于机器学习的Python库,它提供了各种工具和算法,用于数据挖掘和数据分析。Scikit-learn包含了许多常用的机器学习算法,包括分类、回归、聚类、降维、模型选择和预处理等功能。

学习地址:scikit-learn中文社区

多项式回归是线性回归的一种扩展,它允许模型更复杂的关系,如曲线。在Python中,多项式回归可以通过`numpy`库或`scikit-learn`库来实现。下面是一个简单的多项式回归实现的示例代码。 首先,你需要安装`scikit-learn`库(如果尚未安装): ```bash pip install scikit-learn ``` 然后,你可以使用以下Python代码: ```python import numpy as np from sklearn.linear_model import LinearRegression from sklearn.preprocessing import PolynomialFeatures from sklearn.pipeline import make_pipeline # 假设我们有一些数据点 # X是一个二维数组,每一行代表一个样本,每一列代表一个特征 # y是一个一维数组,包含每个样本的目标值 X = np.array([[1], [2], [3], [4], [5]]) y = np.array([1, 4, 9, 16, 25]) # 创建一个多项式回归模型,这里我们设置degree=2来实现二次多项式回归 degree = 2 model = make_pipeline(PolynomialFeatures(degree), LinearRegression()) # 训练模型 model.fit(X, y) # 现在模型已经训练好了,可以用来预测新的数据点 X_new = np.array([[6], [7]]) y_new = model.predict(X_new) print("预测的结果:", y_new) ``` 这段代码首先导入了必要的模块,然后创建了一些样本数据`X`和对应的目标值`y`。接下来,它创建了一个多项式回归模型,该模型通过`PolynomialFeatures`和`LinearRegression`组合而成,其中`PolynomialFeatures(degree)`用于生成多项式特征,`LinearRegression`用于拟合线性模型。接着,使用`.fit()`方法训练模型,并使用训练好的模型进行预测。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值