gff文件_GTF与GFF文件所有操作尽在这里

本文介绍了GTF和GFF两种格式的基因组注释文件,包括它们的结构、信息内容以及如何使用gffread进行GTF与GFF的转换和过滤操作。此外,还提到了gffcompare工具用于评估转录本组装软件的准确性、合并多个GFF/GTF文件以及比较不同注释文件。
摘要由CSDN通过智能技术生成

一、格式介绍

(一)gtf文件。GTF 为General Transfer Format缩写,跟 GFF2格式类似。相信大家做转录组分析时候经常会看到Cufflinks或者Stringtie软件对转录组进行定量与组装会时产生一个gtf文件,里面包含的信息如下:

每列信息的含义如下:seqname- 序列的ID,可以是染色体的ID也可以是Scaffold或者Contig的ID。

source- 产生此文件的软件,如Stringtie产生的则为Stringtie,CUfflinks产生的则为Cufflinks,不知道的使用点 “.” 表示。

feature- 后面start和end之间区域代表的特征,如果此区域是基因,则此处为gene,如果是外显子,则为exon,如果是转录本,则为transcript,如果是非编码RNA则为lncRNA,如果是重复序列,则为TE,等等,主要表明这一块区域的特征。

start-上述feature的在序列上的起始位置。

end- 上述feature的在序列上的终止位置。

score- 一个浮点数值,也可以为点 “.” 。有值的时候代表上述feature的可靠

性。因为无论是gene还是mRNA,都是基于预测差生的,因而必然会有一个值来衡量预测准确性。

strand- + (forward)或者 - (reverse),代表上述feature是位于正链还是负链上。

frame- 内含子相位,只能为'0', '1' or '2

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值