自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 task5

模型融合的策略: 1.简单加权融合: 回归(分类概率):算术平均融合(Arithmetic mean),几何平均融合(Geometric mean); 分类:投票(Voting) 综合:排序融合(Rank averaging),log融合 2.stacking/blending: 构建多层模型,并利用预测结果再拟合预测。 3.boosting/bagging: 多树的提升方法 stacking的核...

2020-04-04 20:14:58 57

原创 TASK3

1,模型: 1),线性回归模型 https://zhuanlan.zhihu.com/p/49480391 2),决策树模型 https://zhuanlan.zhihu.com/p/65304798 3),GBDT模型 https://zhuanlan.zhihu.com/p/45145899 4),XGBoost模型 https://zhuanlan.zhihu.com/p/45145899 ...

2020-04-01 21:00:11 57

原创 TASK3

特征工程 目标 对于特征进行进一步分析,并对于数据进行处理 完成对于特征工程的分析,并对于数据进行一些图表或者文字总结并打卡。 内容 常见的特征工程包括: 1、异常处理: 通过箱线图(或 3-Sigma)分析删除异常值; BOX-COX 转换(处理有偏分布); 长尾截断; 2、特征归一化/标准化: 标准化(转换为标准正态分布); 归一化(抓换到 [0,1] 区间); 针对幂律分布,可以采用公式: ...

2020-03-28 19:14:28 49

原创 无基础DatawhaleTASK2

1.EDA的作用 EDA的作用主要在于熟悉并了解数据集,对数据集进行处理,以便接下来机器学习或者深度学习使用 了解数据集之后,接下来就是了解数据集中各变量间的相互关系,变量与预测值之间的关系 引导数据科学从业者进行数据处理以及后面特征工程的部分,使得数据集的结构和特征集让接下来的预测问题更加可靠 完成对于数据的探索性分析,并对于数据进行一些图表或者文字总结并打卡。 2.内容介绍 1、载入各...

2020-03-24 20:04:32 79

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除