【全网最佳】2024长三角数学建模B题成品论文25页（附带py+matlab双版本完整解题代码）+保姆级教程

本文链接：https://blog.csdn.net/2301_77933700/article/details/139013762

人工智能在物理化学中应用

2024长三角数学建模B题成品论文25页+完整可执行代码+运行结果可视化图表https://mbd.pub/o/bread/ZpaTk5du

摘要：

针对问题 1 ，首先需要对数据进行预处理，检测是否有缺失值、异常并进行修正，同时对需要的数据进行数据标准化与归一化操作。要想探究y2 与分子 id 之间是否存在有一定的函数关系，那么在处理好数据之后，要进行y2 与分子 id 的特征分析，将两个变量进行可视化，大致分析y2 与分子 id 之间的函数关系，最后采用适当的函数，即多项式回归拟合建立函数，并对y2 进行合理预测。针对问题 2，

针对问题 2 ，与问题 1 类似，采用同样的方法检查缺失值并剔除异常值。要想选择不超过 10 个的特征指标，那么就要分析y2 ~y3 , x1 ~x100与y1 的相关性，寻找用于计算特征与目标变量之间相关性的函数，选取相关性最大的 10 个变量作为特征指标，然后建立y1 预测模型进行预测。根据要求，问题 2 采用了 SelectKBest 方法结合 f_regression 函数从训练数据集中选择对目标变量 y1 影响最大的 10 个特征，然后使用随机森林对数据进行训练并最终预测。

针对问题 3，在检查缺失值并剔除异常值之后，要想分析y3 与y1 ~y2 , x1 ~x100 之间的函数关系，仍旧采用 SelectKBest方法选取相关性最大的 10 个特征指标，来获取对y3 预测结果最大的特征指标。采用基于梯度的回归模型对 10 个特征指标进行训练并预测y3，最后基于模型的均方误差（MSE）来分析这些指标的灵敏度。

针对问题 4，需要分析 class 与y1 ~y3 , x1 ~x100指标之间的关系，并于物理化学性质，建立分子的类别预测模型，分析y1 ~y3 , x1 ~x100 中对分类结果影响较大的指标。首先找出y1 ~y3 , x1 ~x100 中对 class 变量影响最大的 10 个指标，然后采用 RandomForestClassifier 分类模型对 class 进行分类，最后来评估分类准确率。

针对问题 5 ，需要选择更好的方法来提高模型的检测精度。对于y1 , y3 变量的预测，尝试用更多的特征值（本题增加至 20 个特征指标）来提升检测精度，对于类别 class 的预测，通过建立深度学习的神经网络（LSTM）模型并结合随即森级分类进行预测以提升预测精度。

5.4.1 特征指标关系分析与分类模型构建 14

5.4.2 预测与评估 15

5.5 问题 5 模型建立与求解 17

5.5. 1 xxx 方法介绍错误！未定义书签。

5.5.2 模型优化与测试错误！未定义书签。

5.5.3 测试结果与评估错误！未定义书签。

一、问题重述

1.1 问题背景

随着科学技术的飞速发展，化学和物理领域的研究逐渐进入了一个复杂化和高维化的新时代。传统的研究方法，如“ 穷举” 、“试错”和“重复” ，在面对庞大的化学空间时显得捉襟见肘，往往只能达到局部最优而非全局最优。为了突破这一瓶颈，中国科技大学机器化学家平台应运而生，它凭借大数据与智能模型的双重驱动，实现了化学合成、表征和测试的全流程自动化开发，为化学研究带来了革命性的变革。该平台不仅在软硬件上全面超越了欧美同类装置，更在智能化方面取得了显著成就。作为一个集成了计算大脑、理论模型和开放式操作系统的智能平台，它拥有强大的化学智能和广泛的化学品开发能力。通过先进的机器智能技术，平台能够自动查找和阅读大量文献，从海量的研究数据中提炼出专家的智慧，并在此基础上提出科学假说并设计实验方案。此外，该平台还能调度移动机器人和智能化学工作站，高效完成化学实验的各个环节，并通过自动化的数据采集、处理、分析和可视化，为研究者提供全面而精准的数据支持。

中国科技大学机器化学家平台以其卓越的性能和广泛的适用性，为化学研究注入了新的活力。通过该平台，我们能够突破传统研究范式的限制，实现化学知识的数字化理解、操作指令化和创制模板化，引领化学研究迈向一个更加智能、高效的未来。而数据预测研究作为平台的重要应用之一，将为我们揭示更多化学世界的奥秘，推动化学科学的持续发展。

1.2 问题回顾

在中国科技大学机器化学家这个平台上，数据的预测研究是一项重要的工作。现在需要通过数据分析，构建数学模型，帮助实验室里的机器化学家解决下列的预测与分类问题：

问题 1：对题目所给数据进行预处理，明确你们处理数据的必要性和所采用的处理方法。研究y2 与分子 id 之间是否有一定的函数关系，尝试直接通过 id 变量来预测y2 ；并将 predict.csv 预测结果填入在附件 submit.csv 文件中。