miRNA数据库篇——Rfam数据库

Rfam——非编码RNA家族数据库

Rfam是一个RNA分类信息的数据库,根据多序列比对结果,二级结构的一致性,协方差模型对各种RNA及顺式作用元件进行了分类整理,网址如下

http://rfam.xfam.org/

在这里插入图片描述

最新版本为14.1, 在Rfam数据库中,包括以下3大功能类型的分子

  1. ncRNA genes

  2. cis-regulatory elements

  3. self-splicing RNAs

进一步对其进行更为细致的划分,详细列表如下所示

img

(上图来自生信修炼手册)

在对这些数据进行分类时,提供了两个层次的分类,familyclan。对于family而言,其成员是上述各种类型的RNA;对于clan而言,其成员是各个family

通过官网的Browser功能,可以方便的浏览数据库中的内容,根据类型的不同进行数据检索。

1. family

每个family采用RF开头的编号唯一识别,示意如下

在这里插入图片描述
以上图中的RF02924为例,该家族的名字为skipping-rope, 对应类型为Gene; sRNA, 该家族包含来自360个物种的RNA分子。

对于多序列比对的信息,同时提供了seedfull两种,其中seed是手工整理的已知的该家族成员的多序列比对结果,而full是该家族所有成员序列的多序列比对结果。

2. clan

每个clan采用CL开头的编号唯一识别,示意如下,以下图中的CL00051为例,包含了11个family

在这里插入图片描述

3. genome

示意如下
在这里插入图片描述

human为例,可以看到对应的序列数和family个数

在这里插入图片描述

点进去可以查看human的family信息:

在这里插入图片描述

选择左侧栏的miRNA选项,就可以查到此数据库收录的人类miRNA:

在这里插入图片描述

4. sequence

根据序列检索

在这里插入图片描述

KB707684.1对应的序列详情如下

在这里插入图片描述

通过FTP功能,可以下载该数据库中的内容,FTP链接如下

ftp://ftp.ebi.ac.uk/pub/databases/Rfam

在这里插入图片描述

可下载不同版本的数据库数据。

最新的14.1版本:

在这里插入图片描述

数据库中不仅提供了fasta格式的序列信息,也提供了CM模型,通过infernal软件可以利用这些模型对RNA序列进行判断,从而分析RNA序列对应的family信息。

参考资料:
作者:生信修炼手册
链接:https://www.jianshu.com/p/2f63ee75cf27
来源:简书

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值