《特征工程入门与实践》读书笔记一

       自己在实际的工作和平时的学习中,深深地感受到数据和特征的重要性。正如“Garbage in, garbage out”(错进,错出)所说,对于机器学习中,数据和特征往往决定了结果的上限,模型、算法和优化策略则是逐步在逼近这个上限(注:该话的大意来自于《百面机器学习》这本书的第一章—特征工程)。自己查到了市面上关于介绍“特征工程”的书籍,从讲解的详细程度和实践性出发,选择了《特征工程入门与实践》这本书作为参考书籍。下面是我读完这本书后所总结的读书笔记。

1. 特征工程简介

        特征工程的意义:在现实中很少有像机器学习竞赛和学术文献中那样干净的数据,在对原始数据的利用过程中,必须要将数据转化为更好地可以表现潜在问题的特征,才能更好地作为机器学习算法模型的输入,从而得到较为理想的模型性能。

        特征工程的评估:(1)得到基准模型的性能;

                                     (2)应用至少一种特征工程;

                                     (3)对于每种特征工程,获得对应的性能指标;

                                     (4)若指标的提升(相对于原模型的相对提升,用百分数表示)大于我们自己定义的阈值,则可以在机器学习流水线中应用该特征工程。

        特征工程的评价指标:分类:准确率、召回率、F1、AUC、特定领域的性能指标(如搜索推荐中的指标);

 

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值