12选择好特征

我在这节视频观看到的选择好的特征,仅仅是观察得到的一些结论,并没有涉及到很复杂的特征选择问题,什么信息熵什么互信息等等概念,只是从特征本身,观察的到的,其实这些都可以通过数学的或者信息论的知识进行推导,但这节我们不讨论。

对于分类问题,简单点来说,那些有利于我们区分的特征就是好的特征。那些不利于我们判断,甚至混淆我们的感官,带来一些没用的信息,加重我们的分析的特征就是不好的特征。

对于如何选择好的特征,讲到了三点:

1、避免无意义的特征

例如:对于区分金毛和吉娃娃来说,颜色就不是一个好的特征。

2、避免重复性的特征

例如:房屋预测问题中,房子的长、宽、面积,显然长和宽是一组重复性的特征。(当然没有考虑一些其他情况)

3、避免复杂的特征

例如:预测小明从家到学校的时间,存在距离、经纬度两个属性,显然处理经纬度更加麻烦。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值