linux可变剪切分析,SpliceR:一个用RNA-Seq数据进行可变剪接分类和预测潜在编码区域的R包...

SpliceR:一个用RNA-Seq数据进行可变剪接分类和预测潜在编码区域的R包

Kristoffer Knudsen, Johannes Waage5Dec2013

翻译:斑斑<23920620>

2016年7月14日

欢迎加入生物信息QQ群78750864讨论相关问题

1简介

SpliceR是一个可以对转录本完整isoform(剪接模式)进行分类的R包。这些转录本可以是由Cufflinks等工具通过组装RNA-seq数据产生的。SpliceR输出的是关于可变剪接的类别及转录本对无义介导的降解机制的敏感性。SpliceR还提供导出GTF格式的文件用以在基因组浏览器中浏览,以及少量的绘图功能。spliceR位于典型RNA-Seq分析流程的末端,使用由组装工具生成的full devoncoluted isoforms,并支持输出剪接元件的基因组位置,促进了序列元件的下游分析。

SpliceR在SpliceRList对象中存储转录本信息,由两个GRanges对象构成,‘转录本特征’和‘外显子特征’。作为GRanges对象的‘转录本特征’ 包含关于每个isoform的额外信息,涉及产生它的基因和表达值。作为GRanges对象的‘GRanges’包含所有的外显子和一个能回溯到‘转录本特征’的isoform ID列。SpliceRList对象可以使用内建的prepareCuff函数通过Cufflinks的工作流程来生成,然后直接从一个Cufflins的辅助包——cummeRbund创建的cuffDB对象中读取。可选的,SpliceRList还可以从用户提供的由RNA-Seq组装工具生成的转录本和外显子信息中手动产生。

此外,spliceR通过annotatePTC()提供了关于无义介导的降解敏感性的转录本注释,通过spliceRPlot()进行可视化,通过generateGTF()生成用于基因组浏览器的GTF格式文件,以及一些辅助功能。

1.1可变剪接的类型

spliceR使用以下剪接类型注释‘transcript features’GRanges对象。

?单外显子跳跃/包含(ESI, Singleexonskipping/inclusion)

?多外显子跳跃/包含(ESI, Multipleexonskipping/inclusion)

?内含子滞留/包含(ISI, Intronretention/inclusion)

?可变5'/3'剪接位点(A5/A3,Alternative5’/3’splicesites)

?可变转录起始位点/可变转录终止位点(ATSS/ATTS, Alternativetranscriptionstartsite/transcriptionterminationsite)

?多外显子互斥(MEE, Mutuallyexclusiveexons)

2Cufflinks工作流程

Cufflinks是Tuxido套装的一部分,有着完善的文档和技术支持,用来对RNA-Seq数据进行映射、组装和定量。Tuxido工作流程的末端分析通常依赖cummeRbund包,它能利用R的分析和可视化能力将cufflinks的输出结果进行转换。SpliceR提供了prepareCuff()函数来将cummeRbund中的cuffSet类轻松的转换为spliceR中的SpliceRList类。SpliceR需要关于isoform及构成它的外显子的基因组坐标的全部信息。当生成cuffSet对象时,必须提供Cufflinks输出的转录本GTF文件。这里,我们使用由cummeRbund提供的内置数据来生成一个SpliceRList:

>library("spliceR")

>dirtempdir()

> extdatasystem.file("extdata", package="cummeRbund")

>file.copy(file.path(extdata,dir(extdata)),dir)

[1]TRUETRUETRUETRUETRUETRUETRUETRUETRUETRUETRUETRUETRUETRUETRUE

[16]TRUETRUETRUETRUETRUETRUETRUETRUE

> cuffDBreadCufflinks(dir=dir,+gtf=system.file("extdata/chr1_snippet.gtf",package="cummeRbund"),genome="hg19",rebuild = T)

> cuffDB_spliceRprepareCuff(cuffDB)

SpliceRList是一个列表,包含两个GRanges对象,转录本特征和外显子特征,包含的信息分别为基因组坐标,转录本和转录本的基因ID,以及构成它们的外显子。使用prepareCuff()在转录本特征中能够创建附加的元列,这可以在spliceR稍后的工作流程中做进一步过滤。此外,SpliceRList对象还包含关于样品名称、数据来源、应用过的过滤条件以及被spliceR使用的其它数据。

我们还提供了一些有用的函数来提取转录本和外线子的GRanges数据,以及样品的名称:

> myTranscriptstranscripts(cuffDB_spliceR)

> myExonsexons(cuffDB_spliceR)

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值