- 博客(4)
- 收藏
- 关注
原创 task5
模型融合的策略: 1.简单加权融合: 回归(分类概率):算术平均融合(Arithmetic mean),几何平均融合(Geometric mean); 分类:投票(Voting) 综合:排序融合(Rank averaging),log融合 2.stacking/blending: 构建多层模型,并利用预测结果再拟合预测。 3.boosting/bagging: 多树的提升方法 stacking的核...
2020-04-04 20:14:58 57
原创 TASK3
1,模型: 1),线性回归模型 https://zhuanlan.zhihu.com/p/49480391 2),决策树模型 https://zhuanlan.zhihu.com/p/65304798 3),GBDT模型 https://zhuanlan.zhihu.com/p/45145899 4),XGBoost模型 https://zhuanlan.zhihu.com/p/45145899 ...
2020-04-01 21:00:11 57
原创 TASK3
特征工程 目标 对于特征进行进一步分析,并对于数据进行处理 完成对于特征工程的分析,并对于数据进行一些图表或者文字总结并打卡。 内容 常见的特征工程包括: 1、异常处理: 通过箱线图(或 3-Sigma)分析删除异常值; BOX-COX 转换(处理有偏分布); 长尾截断; 2、特征归一化/标准化: 标准化(转换为标准正态分布); 归一化(抓换到 [0,1] 区间); 针对幂律分布,可以采用公式: ...
2020-03-28 19:14:28 49
原创 无基础DatawhaleTASK2
1.EDA的作用 EDA的作用主要在于熟悉并了解数据集,对数据集进行处理,以便接下来机器学习或者深度学习使用 了解数据集之后,接下来就是了解数据集中各变量间的相互关系,变量与预测值之间的关系 引导数据科学从业者进行数据处理以及后面特征工程的部分,使得数据集的结构和特征集让接下来的预测问题更加可靠 完成对于数据的探索性分析,并对于数据进行一些图表或者文字总结并打卡。 2.内容介绍 1、载入各...
2020-03-24 20:04:32 79
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人