华中科技大学药学院本科在读。
Undergraduate in HUST, TJMC, Pharmacy School.
很可行,自学Python,毕设是超大化合物数据库的虚拟药物筛选方法。用的就是机器学习里面的方法。
机器学习辅助药物设计并不罕见。1990年就有学者提出了通过经验性的特征提取方法计算分子描述符/分子指纹进行定量构效关系的方法。今年Cell上发的MIT学者Stokes发的A Deep Learning Approach to Antibiotic Discovery这篇文章,就是一个很好的应用实例。
而且因为偏工程,这个领域门槛很低,甚至仍有人再用1990年就有的定量构效关系模型水文章。换模型,换体系地在做应用。其实数理要求很低,大部分模型当作黑盒即可。
很多人考虑到的数据来源问题,其实很好解决,因为大多数的药物成药性不好一般体现在以下几个方面,活性、毒性、选择性、稳定性、生物代谢,我们现在的思路大都是直接把这些性质分开考虑。
相对于大型化合物数据库几乎痕量的成药化合物,用机器学习模型分析化合物是否满足成药性的某一部分是常用的方法,虽然数据仍然不平衡,但是基本上还能找到足够的数据。
而且这个问题并不只可以是一个生成式问题,还可以一个筛选式问题,其实现在靶点很多,数据库中化合物也很多,只需要判断已存在化合物是否针对特定靶点有活性即可。