第一题是非常经典的机器学习分类过程,
首先第一步,我们需要做可视化分析。通过一些统计学方法来分析磁通密度的分布特征以及不同波形的一个形态特征,那这里可以通过绘制一些例如核密度估计图,双变量影响关系图,描述性统计等等,
其次,第二步,我们需要去构建特征筛选。那特征筛选涉及的方法有很多,例如机器学习特征筛选法。线性回归筛选法,方差筛选法递归消除特征筛选法等等,也可以通过类似主成分分析去做降维。
第三步是去做样本均衡,通过上采样或下采样对比分类的效果。
第四步是数据集划分
第五步是运用各种机器学习方法进行分类例如逻辑回归,xgboost,随机森林,gb dt等等,然后我们可以绘制对应的模型评价图表,例如roc曲线混淆矩阵等等,这里三分类的roc曲线是比较难画的。最后就是对附件二进行相同的处理,然后把分类结果进行回填,按照题目的要求
做出了简单,做得好就比较困难,非常考验大家的模型选择能力。
第二题
第三题
这里有两种方法,第一步就是先用传统的统计学来进行影响分析,可以先通过差异性分析他们之间的差异情况作为补充。然后以磁心损耗为因变量。温度励磁波形和磁性材料作为自变量进行线性回归,通过检查模型的显著性以及标准物相关系数进行分析他们之间的影响情况,然后分析出来这三个因素在什么情况下磁心损耗可能达到最小?那在这里面只能通过相关性来进行分析。
第二种方法是通过机器学习仿真预测的方法&