特征工程包含哪些内容

1:特征理解,看看数据里有什么。拿到数据的第一件事情当然是看数据怎么样了,也就是看里面有什么特征,这些特征是什么意思,这个过程叫做特征理解。看看数据是不是结构化的,是不是有空缺数据,用一些图形看看数据长什么样?

2:特征提升 清理数据。 这一步要做的是在数据理解的基础上,得到一个比较整齐的数据。把未结构化的数据结构化、填充空值、对数据标准化。其中标准化包括z-socre标准化,min-max标准化,还有L1和L2正则化。 这一步完成以后,我们基本上得到了一个干净、整齐一点的数据。但是这并不能保证我们的数据是和我们的模型强相关的,我们还不能把这些数据用在模型里面,还需要后续的处理。

3:特征选择 去掉坏的特征。有些特征和我们的模型不相关、有些特征是关联的,只需要保留一个就可以了。所以,我们要对这些特征进行选择处理。

4:特征构造 构建未有的特征。 从我们已有的特征里面构建未有的特征,比如从图像的像素里面构建出来是哪类物体的特征。还有一种特征构建是从另外一个已有的数据集里面构建,比如匹配某个人的信息,这个过程叫做实体匹配。

5:特征转换。 这一步里面重要的一步是特征约减,比如使用PCA算法进行降维处理。

6:特征学习。 让我们使用机器学习算法来进行特征的学习,典型的如神经网络,它里面就有这种思想。




  • 4
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值