【电子书奖励计划】特征工程

第一章主要是对于特征工程的介绍,阐述了特征工程的重要性。在机器学习工程师和数据科学家日常工作中,超过50%的时间事实上都是在数据的准备阶段。这其中包括存储,清洗,组织数据等等。特征工程就是这样的一个过程:将数据转换为能更好地表示潜在问题的特征,从而提高机器学习的学习性能。一个完整的特征工程包括对于数据中特征的理解,特征增强:清洗数据,特征选择,特征构建,特征转换,特征学习。最后本章还介绍了特征工程的评估。

第二章对于数据集特征的理解进行了介绍。通过本章的学习,可以掌握对于数据等级的划分,包括定类,定序,定距,定比等级。最后,不同等级的数据可以进行的描述性分析以及常用图表给出了介绍,加强了我的理解。

第三章是对于特征增强:清洗数据的介绍。本章从对于缺失值的识别开始,介绍了缺失值的删除,缺失值的常用填充方法,数据归一化处理(z-score,min-max,行归一化),并且介绍了使用sklearn完成上述步骤的方法。最后使用Pipeline进行了演示,直观且容易理解。

第四章则是从特征构建的角度,介绍了常用的特征构建方法,并以流水线的方式进行了总结,学完这章真的收获满满啊!

第五章进一步对选择合适的方法进行了介绍,介绍了两种类型:基于统计和基于模型的特征选择。

第六章从特征转换,维度缩减降维的角度进行了介绍。并以机器学习中常用的鸢尾花数据集为例,使用PCA和LDA进行了学习。

第七章则从特征学习的角度,以神经网络深度学习来创建新特征。

第八章给出了在特征工程中两个实际案例,通过实际操作介绍了完整的特征工程处理流程。

学完全书,对特征工程有了更深的理解,对于整个操作流程有了认识,虽然是本入门的书,介绍的案例也比较简单,但是谁还不是从最基础开始呢?期待下一个电子书学习计划!!!感谢图灵社区啊啊啊!!

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值