bat 注释_号外号外~权威发布啦~ sRNAanno数据库(含138种植物小RNA注释数据)与IGV-sRNA...

测序数据,只有整理,才能成为可解读的生物信息;

生物信息,只有共享,才能实现更清晰的解读。

为此,从课题组特色出发,我们整合并对外开放,植物小RNA注释数据库 – sRNAanno (sRNA annotation缩写,www.plantsRNAs.org)。sRNAanno数据库可以提供什么?

1)138种植物sRNA位点注释信息下载(.gff3),应该是目前植物中最全最完整的数据。

2)植物miRNA位点(家族名字或序列)和PHAS位点(序列)的检索。

3)专门用于查看小RNA高通量数据的工具 -- IGV-sRNA。在整合数据库期间,我们也改造IGV(IntegrativeGenomics Viewer)并得到IGV-sRNA,使得其能够特异地用小RNA

4)sRNAanno还提供免费小RNA注释服务。对于有合理小RNA注释需求的朋友,同样可以登录网页并提交数据信息,我们将提供注释服务!

首先我们关于sRNAanno和IGV-sRNA的文章已经在BioRxiv上作为预印本发表了,欢迎参阅(https://www.biorxiv.org/content/10.1101/771121v1)。

ae1792b6247856863f446aaeca0a9b80.png

植物sRNA位点注释值得更多的关注

植物小分子RNA(sRNA)是一类长度为20~24nt的RNA。越来越多的实验已经证明,sRNA广泛参与到植物各类生物学过程,包括种子萌发,幼苗生长,逆境响应,抗虫抗病,跨界调控,生长发育,开花结果等。

185921583887e767a23724101037c603.png

(Chen et al., 2018, Horticulture Research)

伴随高通量测序技术的普及,越来越多的植物基因组得到测序(约400种,2019年09月)。这些基因组往往也有较好的蛋白编码基因的基因结构注释,极大地加速了蛋白编码基因的研究。但与此同时,sRNA位点的注释,却往往被忽略。这既造成数据的闲置,也从某个角度来说,阻碍了一些研究的开展。比如,当群体数据分析结果事实上定位到一个sRNA产生位点,而分析人员并没有sRNA位点的注释,那么或者是直接错过该位点的发现,或者是需要花更多的精力做数据分析

植物sRNA位点注释明显缺失

植物sRNA主要包括三大类:

  • microRNA (miRNA)

  • phased small interferencing RNA (phasiRNA,相位siRNA)

  • heterochromatic siRNAs (hc-siRNA,异染色质siRNA)

其中miRNA受到的关注较多,存在系列软件可以分析,如Dr. Michael J.Axtell等小RNA大牛的ShortStacks。但总的来说,相比于RNAseq数据分析,miRNA的分析并没有相对主流的分析流程。大多数课题组使用的仍然是自编流程。主流软件或流程的缺失,使得不同研究结果存在出入。而更为致命的是,几乎每篇miRNA预测相关的文章,最终的结果往往只附加在文章的附件。没有统一的管理,使得原本应该成为生物信息的研究成果,变成了占据硬盘的无用数据。作为目前最主流的miRNA收录数据库,miRBase上也只收录了80来个植物的miRNA位点,而且这些位点也不齐全。

miRNA,当然值得关注的,而phasiRNAs的重要性同样不言而喻,如华中农张启发老师课题组与华南农刘耀光老师课题组分别证实了水稻的光敏雄性不育直接受一个产生phasiRNA的位点的调控。目前没有广泛使用的phasiRNAs产生位点(即PHAS locus)的预测(注释)流程,同时也没有phasiRNAs收录数据库。这点相比于miRNA更为严重。

此外,作为植物三大类小RNA之一,hc-siRNA与基因表达调控存在直接相关,同样值得做位点注释与信息收录。

数据,只有整理并可用于解读,才会成为生物信息。

共享植物小RNA注释数据库

始于2016年,夏瑞课题组一直在优化和完善植物miRNA,phasiRNAs和hc-siRNAs的注释流程与信息整理。通过这些时间的努力,我们使用统一的流程(参与XIALAB暑期培训的同学应是已经知晓)对目前已有基因组公开序列以及至少一套sRNA测序数据的物种进行三类位点(miRNA, phasiRNA, hc-siRNA)的注释。我们得到了数目明显超过miRBase的miRNA位点注释信息。

fe7f4ecbbfcb609015a6938efef433f8.png

同时,注释的完整度也明显超过miRBase。

2ea32808dd6883769078869d66c0a72f.png

我们也针对所有物种进行了PHAS位点的注释,包括21-nt PHAS和24-nt PHAS,如下

7101ffea21366b3af72f127fba8a8a05.png

(PS: 这个图是用我们开发的工具TBtools做的,效果不错吧!)

目前所有位点的注释信息已经全部上传到sRNAanno,访问www.plantsRNAs.org即可查看。

sRNAanno网站信息简介

打开网站,可以看到

50a6c638493bbccdab86d4ecb1869dcd.png

我们特别喜欢那个会转动的sRNAanno的logo)

整个网站的功能简单:

  1. Browse(查看),用于浏览与物种sRNA注释位点的下载

  2. Search(搜索),用于sRNA位点的查询,如使用名字或序列Blast

  3. Resources(资源),提供sRNA注释服务IGV-sRNA软件下载

Browse

在Browse界面中,通过在左侧进化树中选择所需分支(或单个物种),可获得对应注释文件的下载链接。

812ebe938ff4de0f899147c48b7f4ef1.png

什么?gff3文件不会用?告诉你,可以用我们的TBtools提取相应需要的信息!

Search

在Search界面中,可以输入miRNA家族信息,直接查看该家族的成员信息,

5510694df2a0eea9d589bafd328d9d98.png

当然,你可以通过点击左侧的物种,从而限制搜索范围,

c8af5f4dc4728398db5d2b5d52d15950.png

通过名字的搜索,当然是一个选择。有时候,我们拿到一段序列,想看看这段序列是否是miRNA位点和phasiRNA位点,那么这时候你可以使用Blast功能。

64988fd1d1e3bfc974cd2559e48efa88.png

当结果已经输出,你会发现,结果中miRNA位点都是可以点击的。

825a70ce2e7e02a85b8c14cb3ae37344.png

于是,你会获得该位点的具体信息,

0c969c908c374d7a2363c6e690393944.png

事实上,我们也充分考虑到用户的快速分析的需求,所以Search的操作,其实可以直接在主页上完成。

2d1cc75e655fd5cae36ec8d7f2508767.png 8c04bf107a418e010ce76523eb7b99c2.png

序列直接Blast也是支持的。

a5a21e7a4d98948b1148b34aeb287a03.png

Resource

统一的分析流程,使得我们获得更具可比性的分析结果。但是对于很多wet-lab的科研人员,很多工具不一定会使,会使也不一定有好的计算资源可以用,所以急人所急,我们决定尝试在sRNAanno上提供免费注释sRNA的服务。用户朋友需要提供的只有两类文件的下载信息,就可以在一定的时间内得到对应的sRNA位点注释文件(.gff3)。

a8327bb1a530fd91c45f22171421397c.png

在提交之前,点击感叹号,阅读提交说明。我们在其中说明了所接受的文件格式。

ed6b85b6e331ee26dc2c66e50cf8afbf.png

IGV-sRNA

早前,已有数篇推文,大体讲述了IGV-sRNA的新特性。我们在sRNAanno上可以公开下载。

8e21b470caabde408dd0eaba7f9e0cde.png

在IGV-sRNA中,用户可以更好地完成sRNA位点的人工校对与可视化。具体IGV-sRNA的具体功能可以参看我们的预印本文章,也可以查看sRNAanno网站上的User Guide。或者我们以后会推送更为系统的IGV-sRNA使用说明

86572328aa0db2273cb1eebf090c30a5.png

sRNAanno将作为一个植物小RNA信息的整合中心

滴水石穿,绳锯木断。植物的小RNA数据应该得到更好的利用,小RNA注释位点应该得到更好的整合。正如TBtools的开发一样,至今我们用了四年多的时间,一步一步不断地接收用户的意见和建议,不断地完成更新,走到目前这一状态(2019.01-2019.09Google Scholar 检索“TBtools” Citations: 130+)。sRNAanno是目前第一步,我们也期待对其进行进一步的开发与完善。欢迎有使用问题与改善意见或建议的朋友,与我们联系(sRNAanno@gmail.com)

如果在你们的工作中有用到sRNAanno的相关资源或IGV-sRNA,请引用我们的BioRxiv预印本文章。

Chengjie Chen, Junting Feng, Bo Liu, Jiawei Li, Lei Feng, Xiaoling Yu, Jixian Zhai, Blake C. Meyers, Rui Xia. sRNAanno --- a database repository of uniformly-annotated small RNAs in plants. BioRxiv. doi: https://doi.org/10.1101/771121

890fb420129a89fc8c2f39f048327a64.png
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值