Name: Autonomous reinforcement learning agent for stretchable kirigami design of 2D materials
DOI: https://doi.org/10.1038/s41524-021-00572-y
剪切模型
剪纸结构解释:纵向均匀分为n行(n=4、6、10)横向均匀分布4个点间隔5nm,会出现5nm、10nm、15nm切口,特别说明:端部切口从另一端折回。
每行有13种切口放置,所以模型数为。
强化学习框架(offline RF)
输入是64x64图像(将剪纸模型切割20/64 x30/64纳米片,然后没有任何原子赋值1,否则0,生成图像 ),输出是可拉伸性S。
动态模型通过向RL提供奖励,RL使用该奖励来更新其策略,以最大化其总奖励并创建具有高S的结构。
参考文献: Offline Reinforcement Learning: Tutorial, Review, and Perspectives on Open Problems
代码:https://github.com/rajak7/RL_kirigami.git.
n=4模型
n=6模型
n=10模型
能力有限,此篇论文中offline RF并没有完全看懂!以后会再次阅读。
若有问题,欢迎交流,虚心学习!