机器学习实战笔记6多项式特征

#单个变量的多项式特征

·1.导入库,初始化数据

import numpy as np
import pandas as pd
from sklearn.preprocessing import  PolynomialFeatures

PolynomialFeatures 是 scikit-learn 库中的一个预处理类,用于生成多项式和交互特征。这在处理非线性数据时非常有用,因为它可以通过增加特征的复杂性来帮助线性模型捕捉数据中的非线性关系。

df = pd.DataFrame(
    data = np.arange(10),
    columns=["x"]
)
df

2.将原始特征转换为更高维度的特征空间,使得模型能够捕捉到更复杂的关系。

poly = PolynomialFeatures(degree=2)#将原始特征转换为更高维度的特征空间,使得模型能够捕捉到更复杂的关系。
df_poly=poly.fit_transform(df)
df_poly

使用 PolynomialFeatures 对象 poly 来拟合数据集 df 并转换它,生成多项式和交互特征。这在处理非线性问题时非常有用,因为它可以扩展特征空间,使得线性模型能够捕捉到数据中的非线性关系。

#多个变量的多项式特征

import numpy as np
import pandas as pd
from sklearn.preprocessing import PolynomialFeatures
df=pd.DataFrame({
    "x":np.arange(10),
    "y":np.arange(10,20)
})
df

poly = PolynomialFeatures(degree=2)#实例化
df_poly = poly.fit_transform(df)#拟合并转换数据:使用 fit_transform 方法来拟合多项式特征并转换数据。这将原始特征集转换为包含原始特征和它们之间的所有多项式组合的新特征集。

#拟合并转换数据:使用 fit_transform 方法来拟合多项式特征并转换数据。这将原始特征集转换为包含原始特征和它们之间的所有多项式组合的新特征集。

df_poly

多项式特征(Polynomial Features)是一种数据预处理技术,用于将原始特征转换为更高维度的特征空间。这种技术特别适用于线性模型,通过增加特征的复杂性,可以帮助这些模型捕捉数据中的非线性关系。

基本概念

  • 原始特征:指数据集中的原始变量。
  • 多项式特征:通过原始特征的幂、乘积等运算生成的新特征。例如,如果原始特征为 𝑥1x1​ 和 𝑥2x2​,那么可能的多项式特征包括 𝑥12x12​、𝑥22x22​、𝑥1⋅𝑥2x1​⋅x2​ 等。

多项式特征生成

生成多项式特征的过程通常包括以下几个步骤:

  1. 确定度数:选择生成多项式的最高度数。例如,度数为2时,将生成 𝑥12x12​、𝑥22x22​、𝑥1⋅𝑥2x1​⋅x2​ 等特征。
  2. 生成特征:根据选定的度数,生成所有可能的多项式组合。
  3. 转换数据:将原始数据集转换为包含这些多项式特征的新数据集。

应用场景

  • 线性模型:对于线性模型(如线性回归、逻辑回归等),多项式特征可以扩展特征空间,使其能够拟合非线性数据。
  • 特征工程:在机器学习中,特征工程是提高模型性能的关键步骤之一。多项式特征是一种常用的特征工程方法。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值