纯小白,非专业,仅有自学Python的基础。以此次夏令营为契机,入门下机器学习。
马不停蹄地报名了新一期的夏令营,这一期为AI for Science,选的是AI+生命科学方向,赛题为siRNA药物药效预测。
————
本次学习目标:1.了解AI在生命科学领域应用。2.对代码涉及的专业名词有个理解概念。
本次学习笔记为,从DataWhale的学习手册中(不得不说是很详细的,小白友好)汲取重点知识,用自己的话进行精炼记录,并记录一些思考。
Task1学习笔记
专业概念
1.RNA干扰(RNAi)
- 通过小干扰RNA(siRNA)等沉默特定基因的表达。siRNA结合靶mRNA诱导RISC切割mRNA实现沉默靶基因,在疾病基因疗法中发挥作用。
- 可在siRNA分子中引入化学修饰,以增强其稳定性、靶向性和有效性,形成化学修饰siRNA,如磷酸酯骨架修饰、核苷酸修饰和末端修饰。
2. 深度学习与RNN
深度学习,一种擅长处理复杂非线性关系和高维数据的机器学习方法。递归神经网络(RNN)一类适用处理序列数据的深度学习模型。
3. 词汇表与序列编码
输入深度学习模型时,需将基因序列数据转换为数值表示形式,词汇表即映射方式。
赛题解读
- 从学习手册中给到的赛题解读可以看出,本次赛事的核心目标在于:运用机器学习技术预测化学修饰siRNA药物的药效。
AI在生命科学领域应用
学习手册中介绍了AI在药物发现、基因组学、影像分析、蛋白质结构预测、免疫疗法方面的应用。其中最让我思考的是基因组学方面,因为但从这些名字来看,另外几个都比较容易联想到医药、医疗方面的应用价值,而基因组学呢?
从上述介绍来看,基因组学是精准医疗的切入口,运用AI可以进行一些基因数据的分析,识别疾病相关基因,预测患者药物反应,助力个性化治疗,具体是怎么实现数据分析的呢?有些好奇。