特征工程(1):特征提取、特征构建、特征选择的区别

        特征对于预测而言是相当重要的,在预测建模之前的大部分工作都是在寻找特征,没有合适特征的预测模型,就几乎等于瞎猜,对预测目标而言没冇任何意义。特征通常是指输入数据中对因变量的影响比较明显的有趣变量或属性。

       常见的特征提取、特征构建、特征选择三个概念有着本质不同:

       (1)特征提取:是指通过函数映射从原始特征中提取新特征的过程,假设有n个原始特征(或属性)表示为A1,A2,...,An,通过特征提取我们可以得到另外一组特征,表示为B1,B2,...,Bm(m<n),其中Bi=fi(A1,A2,...,An),i\in [1,m],且f是对应的函数映射,注意到,这里我们用得到的新特征替代了原始特征,最终得到m个特征;

      (2)特征构建:是从原始特征中推断或构建额外特征的过程,对于原始的n个特征A1,A2,...,An,经过特征构建,我们得到m个额外的特征,表示为An+1,An+2,...,An+m,所得到的这些特征都是由原始特征定义的,最终得到n+m个特征。

      (2)特征选择:是指从原始的n个特征中选择m(m<n)个子特征的过程,因此特征选择按照某个标准实现了最优简化,即实现了降维,最终得到m个特征(注意特征并没有发生变化,只是总的数量减少了)。

        

 

  • 7
    点赞
  • 45
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

满腹的小不甘

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值