自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 任务五

把集成学习进一步分类,可以分为两类,一种是把强分类器进行强强联合,使得融合后的模型效果更强,称为模型融合。另一种是将弱分类器通过学习算法集成起来变为很强的分类器,称为机器学习元算法。 我们把用来进行融合的学习器称为个体学习器。 模型融合的代表有: 投票法(Voting) 线性混合(Linear Blending) Stacking。 而机器学习元算法又可以根据个体学习器之间是否存在依赖关系分为...

2020-04-05 20:10:26 107

原创 任务四

1.线性回归模型 线性回归对于特征的要求; 处理长尾分布 理解线性回归模型; 2.模型性能验证 评价函数与目标函数 交叉验证方法 留一验证方法 针对时间序列问题的验证 绘制学习率曲线 绘制验证曲线 3.嵌入式特征选择 Lasso回归 Ridge回归 决策树 4.模型对比 常用线性模型 常用非线性模型 5.模型调参 贪心调参方法 网格调参方法 贝叶斯调参方法 ...

2020-04-01 20:00:07 63

原创 任务三

3.1 特征工程目标 对于特征进行进一步分析,并对于数据进行处理 完成对于特征工程的分析,并对于数据进行一些图表或者文字总结并打卡。 3.2 内容介绍 常见的特征工程包括: 异常处理: 通过箱线图(或 3-Sigma)分析删除异常值; BOX-COX 转换(处理有偏分布); 长尾截断; 特征归一化/标准化: 标准化(转换为标准正态分布); 归一化(抓换到 [0,1] 区间); 针对幂律分布,可以...

2020-03-28 19:23:53 60

原创 任务二

EDA(探索性数据分析) 定义:在统计学中,探索性数据分析(EDA)是一种分析数据集以概括其主要特征的方法,通常使用可视化方法。可以使用或使用统计模型,但主要是EDA是为了了解数据在形式化建模或假设测试任务之外能告诉我们什么。EDA的价值主要在于熟悉数据集,了解数据集,对数据集进行验证来确定所获得数据集可以用于接下来的机器学习或者深度学习使用。了解了数据集之后我们下一步就是要去了解变量间的相互关...

2020-03-24 19:39:49 174

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除