Datawhale AI 夏令营笔记打卡task1

一、Baseline跑通后分数0.5038,纯按照教程来的,通过在打卡里进行对照发现大多数人都是0.5038,应该是初始未进行任何调试的分数。
二、课题理解:
基础知识:
(1)RNA干扰(RNAi)是一种天然存在的基因表达调控机制,机理是抑制基因表达(沉默致病基因)。
(2)化学修饰siRNA是指在siRNA分子中引入化学修饰,以增强其稳定性、靶向性和有效性。它可以用来加强(1)RNAi沉默致病基因的效率。
(3)深度学习与RNN:深度学习是一种基于人工神经网络的机器学习方法,递归神经网络(RNN)是一类深度学习模型,个人目前不是很理解,不过这两个在RNAi效率预测任务中能够通过学习siRNA序列和靶mRNA序列之间的复杂关系从而准确预测其基因沉默效果。
(4)词汇表与序列编码:因为核苷酸的不同排列传达的信息不同而设计的编码,类似于英语单词或者字母与汉语意思的对应(不是很准确的表述,但没有找到更好的解释方式)。
(5)数据处理与特征选择:和生物化学实验的数据处理差不多:将缺失值补全或者去掉,并把异常值去掉,认为修正数据从而提高模型的性能和训练效率。
(6)模型训练与评估:通过数学方法如均方误差(MSE)、平均绝对误差(MAE)、精确率(Precision)和召回率(Recall)等进行模型的评估,同时要避免过拟合。
(7)PyTorch框架:开源,优势是简洁的API和强大的功能,能够快速实现复杂的深度学习模型。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值