数据挖掘实训周报week8

本周理论学习主要学了特征组合

特征交叉一种合成特征的方法,可以在多维特征数据集上,进行很好的非线性特征拟合。假设一个数据集有特征x1和x2,那么引入交叉特征值x3,使得:
x3=x1x2

那么最终的表达式为:
y=b+w1x1+w2x2+w3x3
使用One-Hot向量的方式进行特征交叉。这种方式一般适用于离散的情况,很少用于连续的数据集上。我们可以把特征交叉看成数据的逻辑与操作。

在地图的方面的处理中,需要用到特征交叉。下图的房价和经纬度中,单纯的给出经度或者纬度,都不能直接反应房价和地理位置的关系。更好的方式为经度和纬度交叉点,才能表示位置。

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值