真核细胞中的病毒基因——内源性逆转录病毒 生信工具总结 祖先留下的血源诅咒?

真核细胞中的病毒基因——内源性逆转录病毒 生信工具总结 祖先留下的血源诅咒?

常说一句调侃的话:“质疑某某,理解某某,成为某某。“,一句互联网上的话竟然也真实地映射在生命活动当中。在病毒和人类的旷日持久的战争中,病毒通过整合逆转录入侵人类,人类的免疫系统积极对抗病毒的入侵,使得整合到人类基因组中的病毒序列逐渐被宿主细胞的遗传调控系统“驯化“。这些被驯化的基因被称为内源性逆转录病毒(Endogenous Retrovirus,ERV,也可简写为HERV),由远古逆转录病毒整合于生殖细胞基因组而形成的转座子元件, 是数百万年前远古逆转录病毒入侵整合到人类基因组的遗迹——“古病毒化石”。在漫长的岁月中,ERV占据了人类基因组序列的8%左右,总共超过50万个独立元件,成为重要的基因记忆。而我们现代人正是踩着无数病毒与人类战斗的遗迹,再次投身到这个世界上。今天让我们再度踏组足这些遗迹,重新审视这些ERV的功能。

ERV简介

ERV原病毒两侧有两个长末端重复序列(LTRs),提供调控功能,包括启动子、增强子或引物结合位点,LTR内部由编码基因gag、pro、pol和env组成。ERV原病毒的重组会在整合位置残留一个LTR,因此大多数元件以单独的LTR存在,而在我们的基因组中保持完整的全长ERV大约有4000个。

  • 前病毒的结构,其内部区域(红线)编码gag、pol和env基因,两侧为两个长末端重复序列(LTR)。异位重组发生在前病毒的两个LTR之间,导致内部区域连同一个LTR一起缺失,从而形成单个LTR。摘自:https://news.sciencenet.cn/htmlpaper/2019/3/201932610213752849696.shtm

根据聚合酶(pol)编码基因的序列相似性,可将 ERV 分为三大类。

  • I类HERV的序列与γ逆转录病毒相似

  • II类HERV与β类逆转录病毒相似,

  • III类HERV与人类spumvirus相似。 而根据其引物结合位点 (primer binding site, pbs)的序列相似性,可再将HERV大类细分为若干亚组,各亚组有相应的 tRNA互补序列(如HERV-W有的pbs与色氨酸编码tRNA的3 '末端相匹配) 。各HERV亚组不仅序列同源性有差异,在人类基因组不同位点的序列数量也大为不同。

ERV参与的生物学功能

2022年 CELL 发表 “SnapShot: Human Endogenous Retroviruese” 简述了 HERV 的特性和作用。综述中提出,ERV受到表观遗传层面的调控,且在大多数种类的细胞中的转录活性较低。 事实上,在成人身体组织中,HERV区域的DNA会被甲基化,或形成抑制性的异染色质而导致沉默,抑制性染色体包括krabb结构域、与HERV中的特定序列结合的锌指蛋白等机构。另一方面,RNA介导的靶向效应也参与了哺乳动物ERV的沉默。

最近发表的文献表明,HERV可被多种环境因素重新激活,如感染性因子、外源性病毒、辐射、衰老相关过程、表观遗传药物、细胞因子或有丝分裂原等。因为HERV的LTRs可以作为启动子或增强子,HERV的重新激活会导致病毒转录本和病毒蛋白的产生,影响宿主基因的表达。这些事件可能影响宿主细胞的重要生物功能,如肿瘤和自身免疫性疾病。HERV的异常转录激活与癌症发生和进展都有关系。HERV是转录网络的重要组成,因为HERV的LTRs可以作为强效启动子,如果其整合位点刚好位于基因组特定位置,可能诱导癌基因表达。 此外,HERV的表达可能通过诱导病毒防御途径激活固有免疫应答,固有免疫系统可能将细胞的HERV元件及其表达产物 (DNA、RNA或多肽) 误认为外源性病毒的感染事件

另一方面,基于HERV的病毒类似物也有望诱导免疫系统的抗肿瘤反应,成为新的癌症疗法。通过表观遗传治疗的方式(如DNA甲基转移酶抑制剂)也被证明可以激活HERV的表达,从而引发抗肿瘤免疫反应。然而,其他转座子(如Alus和LINE-1元件)也可能参与其中,转座子与其免疫原性之间的关系还有待进一步的研究。

许多工作也聚焦于ERV在其他领域中的功能,如发育功能,来自德国慕尼黑亥姆霍尔兹中心的Michelle Vincendeau研究组在Cell Stem Cell的研究中,利用CRISPR为基础的手段揭开了HERV-K(HML-2)对于神经分化过程的影响。

还有衰老功能。Liu等在题为Resurrection of endogenous retroviruses during aging reinforces senescence的文献中发现,老年灵长类动物和小鼠的器官以及老年人的人体组织和血清中观察到erv的活化,并证明erv的“复苏”是细胞衰老和组织衰老的标志和驱动力。

ERV被用于治疗的新工具
  1. ERV作为治疗性递送系统更安全且高效,许多团队用内源性逆转录酶构建基因编辑系统。如:SEND 系统 (Selective Endogenous eNcapsidation for cellular Delivery),该系统利用哺乳动物内源性逆转录病毒样蛋白 PEG10 包裹 mRNA,并实现安全高效的 mRNA 递送。研究团队成功使用 SEND 系统将 CRISPR-Cas9 基因编辑相关 RNA 组分递送到小鼠和人类细胞中,并实现对目标基因的高效编辑。

  1. 虽然ERV作为治疗性传递系统更为高效,但是在器官移植的过程中,异源ERV的传播可能导致不可估量的后果,Niu等人在确认perv感染人类细胞后,用CRISPR-Cas9基因组工程灭活了所有ERV拷贝的猪,用于满足器官移植的条件。证明了PERV灭活动物的成功生产,解决了临床异种移植的安全性问题。

ERV计算分析工具

既然ERV如此重要,那么需要用哪些方式来关注ERV的表达呢?海量的高通量测序数据提供给我们无限的资源,同时也有利于我们从宏观的角度关注ERV的表达情况。在二代测序技术出现后,越来越多的物种基因组被公布,尤其是今年来三代测序技术发展,在全基因组水平上系统地挖掘和分析内源性逆转录病毒成为可能。

在基因组层面,Jainy Thomas博士在名为Variation in proviral content among human genomes mediated by LTR recombination的文章中开发了一种新的计算方法,这种方法使得他们能够筛选来自不同人群的大量DNA序列,以发现可能的罕见LTR重组事件。

候选二态HERV位置的核型图。

其他常用的工具包括RetroTector。该方法主要是通过首先识别内源性逆转录病毒两端的长末端重复区域(LTR),接着识别病毒蛋白保守域(motif),再重建原始逆转录病毒蛋白质序列等来实现内源性逆转录病毒的挖掘。

Single-cell RNA sequencing highlights the functional role of human endogenous retroviruses in gallbladder cancer

https://bio.tools/retrotector#!

转录表达层面,随着高通量测序的发展,从转录水平甚至单细胞转录水平关注机制发生已经是家常便饭,而ERV的表达也不在例外,挖掘单细胞水平的ERV的文章也不在少数

  • 杨恩策课题组揭示人类内源性逆转录病毒的表达调控规律 (Genome Biol):作者开发了以从头组装策略为基础的HERV位点特异性识别和定量流程,并对其表达分布模式、遗传调控规律、表观遗传调控规律进行了系统解析。作者将方法应用于GTEx数据库的9466个RNA-seq样本,系统地识别了42个组织部位的共13,889个位点特异性表达的HERV,其中睾丸和小脑表达的hervRNA数量最多,且发现hervRNA可能与大脑的发育相关。 这篇文章的ERV挖掘pepline值得参考:https://github.com/janky-yz/SERVE
    • RNA-seq数据比对

    • HERV区域筛选:提取那些映射到HERVd数据库注释的HERV区域的reads,但这些reads不能与Gencode中的转录本重叠。此步骤通过sambamba工具v0.6.6实现。

    • de novo组装:接下来,提取出来的reads采用Trinity软件v2.1.1进行从头组装(de novo assembly),以构建潜在的HERV转录本。

    • 转录本定量与重新比对:利用Trinity中的align_and_estimate_abundance.pl脚本对组装得到的转录本进行定量,并用GMAP版本2020-06-30将这些转录本重新映射回参考人类基因组。只保留那些相对于参考基因组计数大于5,且至少96%一致性的转录本。

    • 元组装与候选HERV鉴定:使用TACO工具v0.7.3进行元组装(meta-assembly),仅保留那些在至少50%样本中被识别且长度≥200bp的合并HERV候选区段。

    • 候选HERV基因确定:再次将这些候选HERV区域映射到参考基因组,并保留那些唯一映射到HERV位点的基因作为候选HERV基因。

    • RNA-seq数据重新比对与HERV表达量计算:最后,将RNA-seq数据重新比对至参考人类基因组,这次比对时结合了Gencode GTF文件和候选HERV注释信息,以便于后续的HERV定量分析。使用RSEM软件v1.2.28(适应于重复元件量化)计算HERV在基因水平上的表达量。

    • HERV表达判断标准:定义HERV为表达的标准是:原始计数(raw count)大于5,且在至少50%的样本中转录本每百万reads中碱基数(TPM)≥0.1。

  • 崔杰团队应用单细胞转录组技术强调了人内源性逆转录病毒在胆囊癌中的潜在功能(eBioMedicine)。该研究绘制了HERV在各种细胞类型中的转录图谱,证实了HERV在胆囊癌中的异常活化且具有细胞类型特异性以及不同的HERV家族关联的细胞功能存在差异。 该研究通过实验证实了HERV可以发挥增强子的功能,从而改变HERV邻近基因的表达模式。该研究基于HERV的转录特征提出HERVH(HERV家族H类)可作为GBC潜在的早期诊断生物标记物以及HERVH衍生的免疫检查点HHLA2有希望成为GBC的免疫治疗靶点。 作者在这里也整合了这篇文章中的ERV挖掘pepline:
    • 质量控制与初步处理

    • 序列比对与注释:使用STAR软件(v2.5.2b)将读段与人类参考基因组(GRCh38.p12, UCSC版本)进行比对。基因注释信息来自GENCODE网站(Release 31版本),HERV注释信息则由RepeatMasker工具编译并从UCSC表浏览器获取的GRCh38数据集获得。

    • 基因和HERV表达量估算:只考虑唯一比对到基因组的读段,基于这些数据来估计基因和HERV的表达水平。

    • 避免重叠区域偏倚:注意到很多HERV区域会与宿主基因的外显子区域存在重叠,为了避免在量化HERV表达时引入偏差,研究人员去除了这些重叠区域,确保HERV表达量的准确计算。

  • 以及来自Raquel Garza在Cell reports上的研究,关于内源性逆转录病毒在少突胶质细胞中的激活。
    • STAR比对与过滤: 使用STAR版本2.6.0c(RRID: SCR_004463)将测序reads比对至GRCh38.p13版本的人类基因组索引上,并利用GENCODE版本38作为指导RNA剪接位点的GTF文件(--sjdbGTFfile)。为了防止ERV区域导致reads比对的不确定性,在比对过程中设置每个read允许比对到的loci数量(--outFilterMultimapNmax)仅为1个,即只接受唯一比对;同时允许的最大错配率(--outFilterMismatchNoverLmax)设定为3%,这意味着最多允许reads长度3%的碱基与参考基因组不匹配。

    • RetroTector软件预测与量化: 使用RetroTector软件(来源:https://github.com/PatricJernLab/RetroTector),按照先前文献所述方法对人类基因组(版本GRCh38/hg38,来源于https://hgdownload.soe.ucsc.edu/)中的HERV元素进行预测。得分在300分及以上的ERV预测位置和结构被总结在补充表格S2和S3中。然后,利用输出的GTF格式文件,借助featureCounts工具(Subread版本1.6.3,RRID: SCR_012919)进行reads的定量分析。在这个过程中,强制要求reads的方向与其所对应特征的方向一致(通过参数-s 2实现),以保证定量准确性。

总结

物质的本性从来是不变的,重要的是后面操盘的那一只手,虽然ERV是病毒入侵人类留下的有害基因,但却被驯化后参与到如此多的生命活动当中。生命变化,常常令人感叹自然无常。去年的枯枝败叶,分解成尘土,来年春天又萌发出新的花朵。人身体中的细胞,98%会在半年内更新。变的是有形的物质,不变的是无形的像。 就像虽然人类的基因组可能沾染动物、植物、微生物、病毒的成分,但是人都是像我们知道的一样生老病死,从一颗胚胎,到十几岁发育成型,然后三十而立,四十而不惑,最后归于尘土。虽然每时每刻的你都与上一时刻的物质组成不同,但是你从来都认为你是你,这背后操盘的手是什么呢,“你”究竟是什么呢?我想,我们研究追逐的不应该是这些转瞬即逝的物质,比如这些ERV,而应该是后面这双手,让物质服从于规律,让规律恒久不变的力量。

  • 31
    点赞
  • 23
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值