数据分析中,到底什么是特征 feature

在学习数据分析的时候,总是会遇到特征这个词,这个词是翻译过来的,在中文环境中不是很常用,到底什么是特征呢?

数据的总体,叫做数据集,datasets

数据集中的每一行,叫做样本,sample

我们想研究的那一列,叫做标记,label

除了标记这一列,剩下的列,就叫做特征,feature

这个feature有很多意思,

 其实我觉得第一个意思distinctive characteristic这个并不适用于数据分析领域,直译就是独有的特点,确实不是很贴切,但是第二个方面这个意思,就贴切一些,每一列,只是整个数据集的一个方面,这样更好理解一些。比如一个描述用户的数据集,有满意度列,有支付能力列,有消费理念列,这每一列都是这些用户的某一方面。

所以,特征工程,就是分析数据集某一方面,或者多个方面特点的工程。

特征使用,就是使用某一方面,还是不使用某一方面

特征获取,其实就是某一方面数据的获取

特征处理,就是某方面数据的处理

特征监控,就是某方面数据的监控,更新等。

特征选择,就是某方面数据的选择,是否要用,个人觉得就跟特征使用一个意思

特征变换,就是某方面数据的变换,对指化,归一化,离散化,数值化,正规化。

特征降维,就是数据集有众多方面,找主要方面,忽略次要方面

特征衍生,某方面数据可以找到新的规律,生成新的一列数据,更好的描述数据集的某一方面。

  • 6
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值