gffread处理工具

gffread是一款用于处理GFF和GTF格式文件的工具,常用于基因组注释和序列提取。GFF与GTF格式相似,主要用于描述基因和其在染色体上的位置信息。gffread可以通过conda安装,并能进行格式转化、获取CDS、蛋白和转录本序列等操作。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

GFF/GTF格式

01 格式

1.GFF(general feature format ): 通用特征格式,格式由每个特征一行组成,每行包含9 列数据,以及可选的轨道定义行;
2.GTF(gene transfer format ): 通用传输格式,与GFF版本2相同。

02 功能

1.GFF用来注释基因组
2.GTF用来注释基因,比如基因在染色体上的位置(coordinate)及这段区间的其他信息
3. GTF文件和GFF文件都是由9列信息组成,并且这两种文件的前8列基本上是相同的,最后一列信息显示不一致。

GTF的第九列,通常为:
gene_id “At1g00001”; transcript_id “At1g00001.1”;

而GFF的第九列,通常还可以增加一些其他信息,通过分号分割
ID=mrna001;Name=abc
ID=exon1;Parent=mrna001
ID=exon2;Parent=mrna001

gffread

01 软件介绍

gffread可用于验证、过滤、转换和对 GFF 文件执行各种其他操作,gffread是Cufflinks里面的一个子工具(TopHat+Cufflinks来用于转录组的组装,但HISAT2+Stingtie搭配使用效果更好,所以这里不介绍Cufflinks软件)。

02 安装
conda instal

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值