【学习笔记】特征组合

面对非线性问题,我们可能需要特征组合来解决问题。

特征组合是指通过将两个或多个输入特征相乘来对特征空间中的非线性规律进行编码的合成特征。”

我们可以创建很多特征组合。 “在使用扩展的线性模型时辅以特征组合一直都是训练大规模数据集的有效方法。”

在官方文档附带的 playground中,我们就会看到几种特征组合,通过组合x1x2来得到新特征。

比如x1^2,x1*x2,还有sin(x1)等。

 

回到上一章,我们将纬度进行分箱,现在假如我们对经度也进行分箱,在用两个特征矢量相乘,例如

经度=[0, 0, 1, 0, 0]  纬度 = [1, 0, 0, 0, 0] 我们让两者相乘(矩阵乘法,别忘了改shape), 就会得到25个元素的独热矢量。

这里结果为:

import numpy as np

x1 = np.array([0, 0, 1, 0, 0])[:, np.newaxis].reshape(5, 1)
x2 = np.array([1, 0, 0, 0, 0])[:, np.newaxis].reshape(1, 5)

print(np.matmul(x1, x2))

>>>[[0 0 0 0 0]
 [0 0 0 0 0]
 [1 0 0 0 0]
 [0 0 0 0 0]
 [0 0 0 0 0]]

我们也可以对结果进行降维:

import numpy as np

x1 = np.array([0, 0, 1, 0, 0])[:, np.newaxis].reshape(5, 1)
x2 = 
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值