Datawhale AI 夏令营 task 1 笔记打卡

Datawhale AI 夏令营 task 1 笔记打卡

  • [[siRNA]]学习 #ai4science
    • 基本概念
      • RNA干扰(RNAi)
        collapsed:: true

        • RNA干扰(RNAi)是一种天然存在的基因表达调控机制,通过小干扰RNA(siRNA)等分子来沉默特定基因的表达。这一机制在细胞中起着重要作用,能精确地抑制目标基因的表达,从而减少相应蛋白质的产生。siRNA通过与靶mRNA结合,诱导RNA诱导沉默复合物(RISC)切割mRNA,最终导致mRNA降解和基因沉默。在基因治疗和疾病治疗中,RNAi技术有望通过沉默致病基因来发挥治疗作用。
      • collapsed:: true

        化学修饰siRNA

        • 化学修饰siRNA是指在siRNA分子中引入化学修饰,以增强其稳定性、靶向性和有效性。这些修饰可以增加siRNA在体内的稳定性,减少其毒性和副作用,提高其基因沉默效率。常见的化学修饰包括磷酸酯骨架修饰、核苷酸修饰和末端修饰等。这些修饰不仅能提高siRNA的药效,还能减少非特异性沉默,提升siRNA药物的临床应用潜力。
    • 背景知识
      collapsed:: true
      • 长期以来,药物研发领域流传着“双十定律”,即从新药研发开始到产品获批上市,平均耗时十年,投入成本约十亿美元。所幸的是,大数据与人工智能(Artificial Intelligence,AI)的兴起,有望新药的研发走出这个“双十”困局,使药物研发的进度得以加速,成功率得以提高,同时成本也得以大大降低。如提升候选药物品质(改善靶点确证和先导分子优化流程、调整药物用途),优化临床试验设计(基于生物标志物的筛查、患者分级)等。AI制药企业英矽智能通过生成式人工智能筛选靶点并设计的小分子TNIK抑制剂候选药物INS018_055已完成Ⅱ期临床试验首例患者给药,给数以百万计特发性肺纤维化(IPF)病人群带去福音,其从靶点发现到人体临床开启仅用了18个月。AI辅助制药与生命科学研究已经成为一种新的范式。
      • 小干扰RNA (small interfering RNA,siRNA)生物学最重要生物技术之一,是发现能够通过一种被称为RNA干扰(RNA interference, RNAi)的现象来调节基因的表达。siRNA可用作研究体内和体外单基因功能的工具,是一类有吸引力的新型疗法,特别是针对治疗癌症和其他疾病的不可成药靶点。2018年,在结合靶向递送系统和经过高级化学修饰之后,全球首个siRNA药物Patisiran获批上市。如今,越来越多siRNA逐渐进入试验阶段甚至步入临床,这标志着临床领域实现精准医疗将不再只是一句口号,最终惠及更多患者。
      • RNAi作用机制
        collapsed:: true
        • 生物体内,RNAi首先将较长的双链RNA加工和切割成 siRNA,通常在每条链的3’末端带有2个核苷酸突出端。负责这种加工的酶是一种RNase III样酶,称为Dicer。形成后,siRNA与一种称为RNA诱导的沉默复合物(RNAinduced silencing complex, RISC)的多蛋白组分复合物结合。在RISC复合物中,siRNA链被分离,具有更稳定的5′末端的链通常被整合到活性RISC复合物中。然后,反义单链siRNA组分引导并排列在靶mRNA上,并通过催化RISC蛋白(Argonaute family(Ago2))的作用,mRNA被切割,即对应基因被沉默,表达蛋白能力削弱。

    • 传统siRNA设计原则与知识

      collapsed:: true
      • siRNA的沉默效率与众多因素相关,例如siRNA的稳定性、修饰、转染方法等。一些经验的生物知识可用于特征构建和AI模型的设计。在siRNA一般设计过程中有以下知识和原则:
        collapsed:: true
        • siRNA序列(一般为反义链)与靶向RNA互补。
        • siRNA序列长度一般在19~29nt之间。研究表明21nt相比27nt对靶基因的最大抑制率更容易达到。
        • 一般来说,从靶基因起始密码子AUG下游50~100个核苷酸,或位于终止密码子50-100个核苷酸范围内的序列(确保转录基因为沉默状态)搜寻理想的siRNA序列,越靠近靶基因的3′端,其基因沉默效果可能越好。
        • 一般设计好的潜在siRNA序列,会在GenBank数据库进行BLAST,去掉其他基因有显著同源性的靶序列(错误靶向)。
        • 具体序列而言,最好为AA+(Nn)UU(N代表任意碱基,n为碱基数目),其次是NA(Nn)UU和NA(Nn)NN。
        • 一般情况下,siRNA的稳定性直接影响其最终在细胞中的敲低效率。在siRNA的反义链5’端第一个碱基尽量可能是为A或U; siRNA正义链的5’端第一个碱基尽量为G或C。
        • 一般情况下,3′端的2个碱基使用突出的dTdT(deoxythymidine dinucleotide)取代,能够增强siRNA 双链复合体的稳定性,进而增加siRNA的敲低效率。
        • G/C含量在30%~52%的siRNA序列,其沉默基因效果较好。研究表明40–55% GC的含量敲低效率高于GC含量高于55%的。
        • 一般来说,siRNA序列中连续2个及以上G/C能够降低双链RNA内在稳定性,从而降低siRNA在细胞中的敲低效率;而连续3个以上的A和U可能终止由RNA Polymerase III介导的转录作用。siRNA序列中的重复序列或回文结构可能形成发夹状结构,这种结构的存在可以降低siRNA敲低效率。
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值