任务学习时长:1/9——1/10
任务名称:特征工程知识点的讲解以及特征工程对成绩的提高
任务简介:运用特征工程知识对成绩提高到top80%
详细说明:由于特征工程对于后续成绩的提高有着奇特的效果,所以在两次课中会运用特征组合以及管道知识对数据进行处理和特征的组合,希望大家不要完全按照我的方法来进行特征组合,这个时候大家自己要尝试不同的组合,对特征的重要度也需要进行区分。
代码下载
链接:https://pan.baidu.com/s/11hmFMnKqnA1j_5NnpoGzVQ
提取码:wxr6
文档下载:
链接:https://pan.baidu.com/s/1aDyQOoIjTJdkSfO66VFG4A
提取码:1etc
作业名称(详解):截图排名top80%及以上,描述一下pipline对特征组合的方便之处,还有哪些方法可以对成绩有所提高?
作业提交形式:PPT截图或手写拍照,打卡提交。
打卡内容:(可以只是文字提交,或图片提交,或组合都行)
文字要求最少200字
图片要求最少1张
打卡截止时间:1/10
点我打卡!快来提交你的作业吧~
打卡
2.描述一下pipline对特征组合的方便之处
Data Pipeline:
好的机器学习 pipeline 就类似工业生产中的流水线作业或者一个泛化能力强的算法,是包括了从数据输入到最后目标数据的一个完整的流程。
对于特征组合来说,其方便之处就在于便于模型调参或者特征的选择,避免了重新构造模型,其完全是一个自动化的调整。
3.还有哪些方法可以对成绩有所提高?
除了特征组合还有特征重构以及评估的选择、评价函数的选择以及模型的集成等方法,都可以起到提高成绩的目的。