任务
任务时长:1/12
任务简介:
温故而知新,详细总结回顾本阶段所学习内容,与同学分享自己在学习和作业中遇到的问题。
详细说明:
每第一阶段的学习任务都比较重,第一次学过之后特别容易忘,所以及时做一个要点回顾,会让学习效率大大的提升。
如果复习时还有很多不会的,一定要和小伙伴交流或询问助教和老师,不要把问题留到下一阶段。
打卡截止时间:1/12
打卡内容:图片至少1张,一周总结反思
打卡
操作工具:
pandas、matplotlib、seaborn、
sklearn
学习内容:
-
数据可视化与分析:
明确问题:要分析每个变量对这个问题的意义和价值
单因素分析:通过频次直方图来查看变量的分布情况
多因素分析:通过散点图来查看数据的二元分布 -
特征工程
基本(数据)清洗:处理缺失值,删除无用特征等 -
特征重做
选择信息量大的特征进行特征组合,构造新的特征,以提高模型的拟合能力。 -
模型选择、评估和集成
选用多种常用的模型,并使用模型堆叠的做法,显著提高预测效果。