特征工程(如何合理地把非数值特征转换成数值特征)

现在我理解的特征工程的意义是:如何把非数值特征转换成数值特征?
1、假如有一个属性是职业,有这三种职业,教师、公务员、工程师,现在要用一个基于线性回归的算法,来训练模型,假如f(x,y)=ax+by,a,b代表权重,x代表职业这个属性值,那么如何给这个x赋值?

解决方案:
1、人工无脑的赋值,比如教师=1,公务员=2,工程师=3,但是这样科学吗?假设教师和工程师的特征比较相似,这样显然不合适。但是,这种方法依然在用,解决这种不合理的办法是,世界上有许多计算词汇相似度的方法,他能判别各种词汇的相似度,我们根据词汇相似度然后再给他们赋值。
2、离散赋值,比如把职业这个属性再分为三类
特征工程

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值