- 博客(5)
- 收藏
- 关注
原创 DataWhale-数据挖掘学习-ModelFusion
模型融合的介绍模型融合的目标是讲训练好的多个模型结果综合在一起,达到更好的精度与鲁棒性。最简单的想法就是以所有模型的预测结果为输入,以ground truth为目标训练新的的模型。有点深度神经网络的意思,即以深度换取更强的表达能力。但这样就会遇到过拟合的问题,这时可以用K-ford,多个训练集更方法克服。简单加权融合回归最简单的想法就是给每个模型的结果一个权值,将它们加权平均后作为最终结果...
2020-04-04 20:34:51 163
原创 DataWhale-数据挖掘学习-ModelingParameters
拟合模型Liner Regression-线性回归f(x)=wx+bf(x) = wx+bf(x)=wx+b这是对输入和输出一个最简单的拟合,认为输入和输出之间是一个线性关系,每个输入分量在输出结果中起到一定比例的作用。其中需要拟合的参数有w,bw,bw,b,目前有很多方法解决这个问题,比如最小二乘法,梯度下降法等等但需要注意的是,线性回归模型有5个前提假设线性性 & 可加性...
2020-03-31 19:18:50 148
原创 DataWhale-数据挖掘学习-FeatureEngineering
什么是特征工程特征工程一方面是在EDA后对特征进一步处理分析,并根据已有特征结合先验知识构造可能对问题有帮助的特征。另一方面是在已有特征中选择,挑选出有代求问题关系紧密的特征,达到拟合的准确率与鲁棒性的均衡。特征处理异常值清洗在EDA中我们已经完成了对数据缺少,类型异常的处理。但为了进一步提高拟合的准确性,还可以对数据outlayer的部分进行处理。线框图去异常线框图是处理离群数...
2020-03-27 22:30:18 219
原创 DataWhale-数据挖掘学习-EDA
DataWhale-数据挖掘学习-EDA什么是EDA数据分析的要点与流程使用的工具包数据读入与变量认识统计量分析缺省值统计与数据修补预测值分布数据相关性分析与可视化什么是EDAEDA的全称是探索性数据分析(Exploratory Data Analysis),也就是在没有了解的情况下不受约束的分析已有数据,对数据的构成、分布及其特点有整体的了解。并在有了全局了解后使用工具试探性的分析当前数据中...
2020-03-24 19:25:53 529
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人