数据挖掘之建模调参
一般建模与调参大致流程内容(以天池二手车预测为例)
1.线性回归模型:
- 线性回归对于特征的要求;
- 处理长尾分布;
- 理解线性回归模型;
2.模型性能验证:
- 评价函数与目标函数;
- 交叉验证方法;
- 留一验证方法;
- 针对时间序列问题的验证;
- 绘制学习率曲线;
- 绘制验证曲线;
3.嵌入式特征选择:
- Lasso回归;
- Ridge回归;
- 决策树;
4.模型对比:
- 常用线性模型;
- 常用非线性模型;
5.模型调参:
- 贪心调参方法;
- 网格调参方法;
- 贝叶斯调参方法;
数据挖掘建模根据挖掘目标和数据形式大致可建立:分类与预测、聚类分析、关联规则、时序模式、偏差检测等模型
- 1.分类与预测
常见算法信息
python分类与预测算法特点# - 2.聚类分析
常用聚类方法:
Python主要聚类分析算法
- 3.关联规则
关联规则目的:在一个数据集中,找出各项之间的关联关系。
常用关联规则算法
- 4.时序算法
python主要时序算法
- 5.离群点检测
模型调参总结
- List item