自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 DataWhale-数据挖掘学习-ModelFusion

模型融合的介绍模型融合的目标是讲训练好的多个模型结果综合在一起,达到更好的精度与鲁棒性。最简单的想法就是以所有模型的预测结果为输入,以ground truth为目标训练新的的模型。有点深度神经网络的意思,即以深度换取更强的表达能力。但这样就会遇到过拟合的问题,这时可以用K-ford,多个训练集更方法克服。简单加权融合回归最简单的想法就是给每个模型的结果一个权值,将它们加权平均后作为最终结果...

2020-04-04 20:34:51 163

原创 DataWhale-数据挖掘学习-ModelingParameters

拟合模型Liner Regression-线性回归f(x)=wx+bf(x) = wx+bf(x)=wx+b这是对输入和输出一个最简单的拟合,认为输入和输出之间是一个线性关系,每个输入分量在输出结果中起到一定比例的作用。其中需要拟合的参数有w,bw,bw,b,目前有很多方法解决这个问题,比如最小二乘法,梯度下降法等等但需要注意的是,线性回归模型有5个前提假设线性性 & 可加性...

2020-03-31 19:18:50 148

原创 DataWhale-数据挖掘学习-FeatureEngineering

什么是特征工程特征工程一方面是在EDA后对特征进一步处理分析,并根据已有特征结合先验知识构造可能对问题有帮助的特征。另一方面是在已有特征中选择,挑选出有代求问题关系紧密的特征,达到拟合的准确率与鲁棒性的均衡。特征处理异常值清洗在EDA中我们已经完成了对数据缺少,类型异常的处理。但为了进一步提高拟合的准确性,还可以对数据outlayer的部分进行处理。线框图去异常线框图是处理离群数...

2020-03-27 22:30:18 219

原创 DataWhale-数据挖掘学习-EDA

DataWhale-数据挖掘学习-EDA什么是EDA数据分析的要点与流程使用的工具包数据读入与变量认识统计量分析缺省值统计与数据修补预测值分布数据相关性分析与可视化什么是EDAEDA的全称是探索性数据分析(Exploratory Data Analysis),也就是在没有了解的情况下不受约束的分析已有数据,对数据的构成、分布及其特点有整体的了解。并在有了全局了解后使用工具试探性的分析当前数据中...

2020-03-24 19:25:53 529

原创 SDOI省选培训day1小结

今天主要讲了两大块内容,穿插了很多

2014-05-10 23:30:08 434

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除