2021数模国赛B
引用说明
https://www.bilibili.com/video/BV1PY4y1F7zt/?spm_id_from=333.788&vd_source=e9ee6301b85b540e326efc5d25ddece4
https://www.zhihu.com/question/399746344
https://www.bilibili.com/video/BV1Gu4y1F7Uc/?spm_id_from=333.788&vd_source=e9ee6301b85b540e326efc5d25ddece4
问0 数据处理
在这里插入图片描述
问一 对附件 1 中每种催化剂组合,分别研究乙醇转化率、C4 烯烃的选择性与温度的关系,并对附件 2 中 350 度时给定的催化剂组合在一次实验不同时间的测试结果进行分析。
问1-1
对附件 1 中每种催化剂组合,分别研究乙醇转化率、C4 烯烃的选择性与温度的关系
难点:每种组合都要分别分析
论文结构
模型选择
某国一:先描述性展示,再进一步分析多种回归描述关系是 线性/非线性
B007:分子类描述性展示,再皮尔逊相关系数定量分析,最后非线性曲线拟合
问1-2
并对附件 2 中 350 度时给定的催化剂组合在一次实验不同时间的测试结果进行分析。
模型选择
某国一:作图描述性分析
B007:
将副产物x降维 再描述性分析 ????有必要降维??
问二 探讨不同催化剂组合及温度对乙醇转化率以及 C4 烯烃选择性大小的影响
论文结构
模型联系
模型解释
数据处理
模型选择
某国一:法1方差分析
证明哪些x导致差异
再
找x的重要性 可用SHAP值 ,也可以从解释性强的模型的权重出发?
Q3 原理??
法3 开放性 附带描述性 高级描述性
Q4 可以只降维部分维度吗?应该可以吧
B007:2个模型
Q5 线性回归系数法没有标准化吗?偏最小二乘标准了
一是方差其次检验+线性回归系数+残差检验
二是改进模型 偏最小二乘法 +分组主成分(???没看懂) + 模型对比
!模型假设的新意和合理性十分重要
https://www.zhihu.com/question/399746344
Q7偏最小二乘复现
问三 如何选择催化剂组合与温度,使得在相同实验条件下 C4 烯烃收率尽可能高。若使温度低于 350 度,又如何选择催化剂组合与温度,使得 C4 烯烃收率尽可能高。
问3-1
选择催化剂组合与温度,使得在相同实验条件下 C4 烯烃收率尽可能高
数据处理
论文结构
模型优化+1
模型选择
某国一:对每个变量线性回归求x重要性 然后…
B007:两模型,一个是多元线性回归 二是方差分析 改进交互项的线性回归
问3-2
改变约束条件即可
问四 如果允许再增加 5 次实验,应如何设计,并给出详细理由。
论文结构
模型选择
B007:均匀设计实验法
每行每列只有一个点 对称的
Q0 新idea 把高维特征降维 然后和重要的特征作为新维 到三维 可视化
Q1各类题型 如评价类…的代码论文模板
Q2 分析 检验 的前提和原理
Q3 GPT4试有标准答案的题
卡方检验
目的:扔色子 判断采样到的分布是否遵循期望的分布
或 两个类别变量直接是否有相关性
前提:1.互斥和互补:每个观测值都会落入一个,而且仅可以落入一个类别中
2.观测值之间相互独立
3.期望频次----观测次数多
t检验
目的:取代均数相减
前提:1.被测量的变量在总体和样本中呈正态分布。魅族样本量>30 则均值分布趋于正态分布
2 方差齐性 两样本方差不能差太多
3. 2个变量
方差分析
单因素/两因素
目的:检验三组及以上的组间差异的时代替t检验,检测完之后只能知道有差异,不知道具体差异情况,所以要做事后检验
前提:1.正态分布
2.方差齐性
3.独立随机抽样
后面两个都是在单因素的前提上加的
https://www.bilibili.com/video/BV1Gu4y1F7Uc/?spm_id_from=333.788&vd_source=e9ee6301b85b540e326efc5d25ddece4