gff文件_GFF格式说明

。原始定义见

SONG website

gff

是存文本文件,由

tab

键隔开的

9

列组成,以下是各列的说明:

Column 1: “seqid”

序列的编号,编号的有效字符

[a-zA-Z0-9.:^*$@!+_?-|]

Column 2: “source”

注释信息的来源,比如

”Genescan”

”Genbank”

等,可以为空,为空用

”.”

点号代

Column 3: “type”

注释信息的类型,比如

Gene

cDNA

mRNA

等,或者是

SO

对应的编号

Columns 4 & 5: “start” and “end”

开始与结束的位置,注意计数是从

1

开始的。结束位置不能大于序列的长度

Column 6: “score”

得分,数字,是注释信息可能性的说明,可以是序列相似性比对时的

E-values

值或者基因预测是的

P-values

值。

”.”

表示为空。

Column 7: “strand”

序列的方向,

+

表示正义链

, -

反义链

, ?

表示未知

.

Column 8: “phase”

仅对注释类型为

“CDS”

有效,表示起始编码的位置,有效值为

0

1

2

Column 9: “attributes”

以多个键值对组成的注释信息描述,键与值之间用

”=“

,不同的键值用

”;“

隔开,

一个键可以有多个值,不同值用

”,“

分割。注意如果描述中包括

tab

键以及

”,=;”

要用

URL

转义规则进行转义,如

tab

键用

%09

代替。键是区分大小写的,以大

写字母开头的键是预先定义好的,在后面可能被其他注释信息所调用。

预先定义的键包括:

ID

注释信息的编号,在一个

GFF

文件中必须唯一;

Name

注释信息的名称,可以重复;

Alias

别名

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值