一、赛题解析
任务:
构建一个能够准确预测碳氮成键反应产率的预测模型。
通过对反应中所包含的反应底物、添加剂、溶剂以及产物进行合理的特征化,运用机器学习模型或者深度学习模型拟合预测反应的产率。
或者利用训练集数据对开源大语言模型进行微调以预测反应的产率。
总结:
输入:底物和条件,(SMILES)
输出:产率,(float,0-1之间)
二、评价指标
实验真实结果与预测结果$R^2$决定系数来进行评测:
三、利用baseline代码:
1、baseline主要的流程如下:
2、运行程序
通过魔塔平台运行。
https://www.modelscope.cn/my/mynotebook/preset
步骤1,登陆平台后启动运行程序。
步骤2,将比赛中所需要的文件直接拉到baseline中,并对文件进行解压,以及整理文件。
将数据集和代码分开放。
步骤3,运行/mp/code/路径下的代码程序
步骤4,程序运行好后,产生一个submit.txt文件。将此文件提交的比赛官网,等待一会的出分数。
比赛官网链接:
http://competition.sais.com.cn/competitionDetail/532233/format
未调参前的得分:基本分数是0.19到0.21之间波动的
调参后的得分: