使用模型无关元学习（MAML）解决材料化学实验预测中的小样本问题

最新推荐文章于 2024-06-30 14:04:58 发布

齐齐齐传凯

最新推荐文章于 2024-06-30 14:04:58 发布

阅读量882

点赞数 1

文章标签：机器学习

本文链接：https://blog.csdn.net/weixin_43819703/article/details/103923226

版权

使用模型无关元学习（MAML）解决材料化学实验预测中的小样本问题

背景

本次实验只针对于金属化合物（例如MoS2）在化学反应中的催化能力。在同一物质中可掺杂不同元素化合物。例如：在这里插入图片描述 MoS2的4种不同的掺杂方式

简单来说对于同种物质的不同基底的掺杂方式每中化合物共有大约100条数据。因为元素之间的不同匹配，所以整个样本空间的数据规模还是十分庞大的。
但是，因为化学实验的特性，其中几种物质的所有数据都已经完成，对于未做实验的化合物数据却是少之又少。不仅如此，因为计算的时间成本相当大，又让数据的扩充有着很大困难。
那么有没有一种方法，可以在新物质只有几条有效数据时，就能通过这些数据来对整个样本有一个较为准确的评估呢？这样我们就引入了一个小样本学习的问题。

模型无关元学习（MAML）

模型无关元学习是近些年来，在meta-learning中十分优秀的一个模型。论坛中许多大神的讲解也非常多，所以就不做过多介绍。
MAML：https://blog.csdn.net/wangkaidehao/article/details/103110728
iMAML：
https://blog.csdn.net/zz_ytj/article/details/103504234

数据与实验

加入小样本学习后的具体化学反应数据流程：

因为meta-learning的训练方式不同，它不仅仅需要train和test，他还需要
support和query，我们也可以看成support是一个task中的train，那么test同理。
在这里插入图片描述
所以我们把每一个物质（例如MoS2）的化学反应数据看做是一个task，在从每一个task中分出support和query。
每一组数据（task）大概有100条数据，每组数据特征为25（25维）。这些特征还存在关联性，如过使用特征提取，会让数据特征在不损失太多信息的条件下有一个明显的降低。但是对于真实的实验过程中，特征提取之后的数据无法利用先验知识进行监控。所以这部操作存在一定疑问。
在这里插入图片描述
在之前的实验中对于已有数据进行分析是考虑到样本数目为300条，如果是用深度学习的方法，出现过拟合的可能性较大。所以采用机器学习的单层算法：其中SVR的准确度最高，但是如过task中的数据较少时，以上几个模型的分析结果都十分不佳。在之后的工作中如果加入MAML后是否可以使用深度学习的模型来进行预测。
在选取实验时，计划选择在多数据时效果最好的（SVR-RBF）和存在过拟合现象的Recurrent Neural Networks。多项式为在多数据时预测结果可以接受的下限。因为实验时回归类型所以符合的评价指标有（RMSE / MSE / MAE/R-squared）
在这里插入图片描述

齐齐齐传凯

关注

1
点赞
踩
7

收藏

觉得还不错? 一键收藏
4
评论
使用模型无关元学习（MAML）解决材料化学实验预测中的小样本问题

使用模型无关元学习（MAML）解决材料化学实验预测中的小样本问题背景本次实验只针对于金属化合物（例如MoS2）在化学反应中的催化能力。在同一物质中可掺杂不同元素化合物。例如：MoS2的4种不同的掺杂方式简单来说对于同种物质的不同基底的掺杂方式每中化合物共有大约100条数据。因为元素之间的不同匹配，所以整个样本空间的数据规模还是十分庞大的。但是，因为化学实验的特性，其中几种物质的所有数据都已...
复制链接

扫一扫