Guidelines for RNN Transfer Learning Based Molecular Generation of Focussed Libraries:RNN,分子生成,迁移学习

本文探讨了RNN(特别是GRU)在分子生成中的迁移学习应用,研究了数据集大小、分子多样性和超参数对模型性能的影响。通过在ChEMBL大数据集上预训练,然后在18个小数据集上进行迁移学习,实验表明,对于低多样性数据集,迁移学习能有效生成特定功能的分子。结论指出,数据量和多样性是决定训练策略的关键因素。
摘要由CSDN通过智能技术生成

在这里插入图片描述
最近读了一篇在2020.7在Journal of Chemical Information and Modeling(JCIM)发表的有关分子生成的文章,这个杂志是化学2区的,3年平均影响因子为4.107。想分享一下我对这篇文章的理解,如果有不准确的地方,欢迎批评指正。

1 背景

(1)背景
在药物设计中,我们需要的是具有特定功能的小分子,但特定功能分子的数据库较小,因此常使用迁移学习:首先在较大的数据集上进行学习,确保生成分子的有效性,然后再迁移到较小的特定功能的数据集上进行学习,使其具有特定功能。
(2)目的

基于GRU-RNN的迁移学模型在分子生成领域广泛应用,但是数据量的大小、分子多样性以及各种超参数对模型性能的影响并不清楚。因此,在本文中,作者针对这些问题做了一些探究并给出建议。

迁移学习:
目标:将某个领域或任务上学习到的知识或模式应用到不同但相关的领域或问题中。
主要思想:从相关领域中迁移标注数据或者知识结构、完成或改进目标领域或任务的学习效果。

2 模型介绍

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
C语言在关键系统中的使用有以下几个准则: 1. 代码可读性:关键系统的代码需要具备良好的可读性,使得他人能够理解和维护代码。为此,可以采用规范化的命名、注释以及代码缩进等方式。 2. 内存管理:C语言在内存管理方面相对自由,但在关键系统中需要特别注意内存的分配和释放。避免内存泄漏或者访问已释放的内存,可以使用动态内存分配函数时,确保正确使用malloc和free函数。 3. 异常处理:在关键系统中,必须仔细处理各种异常情况,并及时采取对应的措施。使用try-catch语句块可以捕获异常,避免系统崩溃。 4. 确保安全性:关键系统的安全性至关重要,避免安全漏洞的出现是非常关键的。在C语言中,应采取安全编程实践,例如避免使用不安全的函数,如strcpy和printf等,能使用安全版本的函数则尽量使用。 5. 验证和测试:在开发关键系统时,验证和测试是很关键的步骤,以确保系统的可靠性和稳定性。通过使用断言(assert)和各种测试工具,能够及时发现代码中的问题,并予以解决。 6. 兼容性:关键系统常常需要长期运行,因此需要考虑代码的兼容性。在使用C语言编写关键系统时,应遵循可移植性的原则,确保代码在不同平台和编译器上都能正常运行。 总结起来,关键系统中使用C语言需要遵循代码可读性、内存管理、异常处理、安全性、验证和测试以及兼容性等准则,以确保系统的可靠性、稳定性和安全性。
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值