建模调参
在零基础入门数据挖掘的 Task4 建模调参部分,我学习了各种模型以及模型的评价和调参策略。在做好前期的准备工作之后,建模是至关重要的一环,需要根据数据的特点选择合适的模型,同时调参使得模型的效果更好。
学习目标
了解常用的机器学习模型,并掌握机器学习模型的建模与调参流程
完成相应学习打卡任务
学习的主要内容
线性回归模型:
线性回归对于特征的要求;
处理长尾分布;
理解线性回归模型;
模型性能验证:
评价函数与目标函数;
交叉验证方法;
留一验证方法;
针对时间序列问题的验证;
绘制学习率曲线;
绘制验证曲线;
嵌入式特征选择:
Lasso回归;
Ridge回归;
决策树;
模型对比:
常用线性模型;
常用非线性模型;
模型调参:
贪心调参方法;
网格调参方法;
贝叶斯调参方法。
相关原理介绍与推荐
相关算法原理篇幅较长,故摘录课件上列出的学习资料,以备后续学习研究查阅。
1 线性回归模型
link
2 决策树模型
https://zhuanlan.zhihu.com/p/65304798
3 GBDT模型
https://zhuanlan.zhihu.com/p/45145899
4 XGBoost模型
https://zhuanlan.zhihu.com/p/86816771
5 LightGBM模型
https://zhuanlan.zhihu.com/p/89360721
6 推荐教材:
《机器学习》 https://book.douban.com/subject/26708119/
《统计学习方法》 https://book.douban.com/subject/10590856/
《Python大战机器学习》 https://book.douban.com/subject/26987890/
《面向机器学习的特征工程》 https://book.douban.com/subject/26826639/
《数据科学家访谈录》 https://book.douban.com/subject/30129410/
个人收获
本次task涉及的知识较广,包含各类经典模型及调参的方法,通过课件学习及代码实战有了一个初步的感知。如何在一个具体的实际问题中选择适当的模型?需要我们对各类模型有充分的的认识,对数据足够理解。这需要多动手练习。此外调参方法也是因模型而异,需要多多积累。