背景介绍:环状RNA(circRNA)是一类特殊的非编码RNA分子(在活体中有时也有表达),也是RNA领域最新的研究热点。与传统的线性RNA(linear RNA,含5’和3’末端)不同,circRNA分子呈封闭环状结构,不受RNA外切酶影响,表达更稳定,不易降解。大概在2010年开始,RNA-seq技术的发展以及专门的计算管道开发,引爆了circRNA 研究。
![8b7b8dba52b404ae7d7616e9098590d5.png](https://img-blog.csdnimg.cn/img_convert/8b7b8dba52b404ae7d7616e9098590d5.png)
环状RNA的主要类型近年的研究表明,circRNA分子富含microRNA(miRNA)结合位点,在细胞中起到miRNA海绵( miRNA sponge)的作用,进而解除miRNA对其靶基因的抑制作用,升高靶基因的表达水平;这一作用机制被称为竞争性内源RNA(ceRNA)机制。通过与疾病关联的miRNA相互作用, circRNA在疾病中发挥着重要的调控作用。要开展环状RNA研究,那就不得不介绍这个数据库了~
![a15e5d549521adaa262e76d8c8338b5b.png](https://img-blog.csdnimg.cn/img_convert/a15e5d549521adaa262e76d8c8338b5b.png)
circBase 数据库http://www.circbase.org/
circBase 是一个环状RNA的数据库,收录多个物种的circRNA信息,采用了find_circ软件来预测去核糖体文库中的circRNA,数据库可以单个环状和列表形式对环状RNA进行搜索,还可以把全部环状RNA下下来,部署到本地服务器上面,还可以像UCSC一样使用序列进行blat比对,具体功能模块接下来一一介绍。
01
单次搜索可能存在的环状RNA
在首页搜索框中输入要搜索的内容,可输入的内容格式有:
--circBase标识符
--refseq转录本ID
--基因名称
--genomic coordinates
本次以搜索ZDHHC1为例,输入后点Search
![98da0e9697e9b6669e93f1ec8abd180b.png](https://img-blog.csdnimg.cn/img_convert/98da0e9697e9b6669e93f1ec8abd180b.png)
这是出来的结果,有物种信息、基因组上位置,DNA正负链、circRNA 编号、基因组上长度、剪切后长度、检测样本、评分、重复序列、注释、转录本编号、对应基因名称等。Export results中点击可下载结果。
![8d8e08b520f89925c13b0d24396200ea.png](https://img-blog.csdnimg.cn/img_convert/8d8e08b520f89925c13b0d24396200ea.png)
点击position genome browser link后:(表格中蓝色字体的内容可以链接到详细信息)
![8d7a3c4dd4b3399add9d917a188060bc.png](https://img-blog.csdnimg.cn/img_convert/8d7a3c4dd4b3399add9d917a188060bc.png)
点击界面左方has_circ_0039826
has_circ_0039827按钮,会打开新的界面
![93947b89c89e046d3492c31d26a5fc39.png](https://img-blog.csdnimg.cn/img_convert/93947b89c89e046d3492c31d26a5fc39.png)
点击View DNA for this teature(hg19/Human) 按钮,进入序列下载界面,按照默认参数,点击get DNA按钮,即可获取所需的circRNA序列信息。
![ea7227921f6eab2fa7f47200bc6e13a1.png](https://img-blog.csdnimg.cn/img_convert/ea7227921f6eab2fa7f47200bc6e13a1.png)
circRNA序列信息包括“genomic”和“spliced”两个选项,分别是基因组上的信息和转录本信息。同时,也可在基因序列上下游增加长度,依据个人需要进行检索和下载即可。
02
list searc
使用list search可以搜索多个circRNA。在Organism中选好物种,有人、小鼠、线虫等,在list中输入circRNA的名字或者与circRNA相关的基因名或者直接上传文件。
![3beedccac7f7f697004b091827fbbcc2.png](https://img-blog.csdnimg.cn/img_convert/3beedccac7f7f697004b091827fbbcc2.png)
在download中可以下载各物种中的circRNA数据,如果发现自己测序得到的circRNA不在这里面,那有可能就是新发现的circRNA。
在Export results 点击可下载结果(支持xlsx、txtcsv格式),如果要输出环状序列的fa格式的话,点击export fasta,并选择环状剪切的序列;
![88037456bc3fbc51bb5d84622db5321a.png](https://img-blog.csdnimg.cn/img_convert/88037456bc3fbc51bb5d84622db5321a.png)
小tips:
多个环状RNA的选择较好的方式是选择环状RNA剪切长度适中,适合后面进行QPCR验证的,长度小于2000可能会好点,其次,选择比较多样品支持和scores比较多reads mapped上的;
circBase数据库是用到的基因组版本是hg19,但是在实际研究过程中发现circBase提供的位置信息在基因组上面是减1的,所以,从circBase上获得的环状RNA位置信息对应到基因组上,就要加1。
03
table browser
在table browser,circBase提供了更加灵活的筛选策略用户可以筛选各种条件,检索框示意如下:
![078c3226d6cdb1b49cb1c598a97b6d16.png](https://img-blog.csdnimg.cn/img_convert/078c3226d6cdb1b49cb1c598a97b6d16.png)
04
blat
通过blat模块,可以输入fasta格式的查询序列,然后和数据库中的circRNA序列进行比较,,用于了解基因的物种保守性。
![0a6eb6719d4b7990f968e194c4888dd8.png](https://img-blog.csdnimg.cn/img_convert/0a6eb6719d4b7990f968e194c4888dd8.png)
提交时要按顺序粘贴。如果序列为fasta格式,则可以一次提交多个序列(每个序列的标题行均以>开头,并包含序列的名称)。
04
物种序列下载
做组学研究需要整个物种的circRNAs序列信息的时候,可以再导航栏点击”downloads“项进行选择,找到对应的物种,点击下载即可。
![285d670cfa620fe654e3a82624a26e44.png](https://img-blog.csdnimg.cn/img_convert/285d670cfa620fe654e3a82624a26e44.png)
以上就是circbase中基本的、最常用的查询和检索使用方法,实际操作中也非常有用,如果想研究circRNAs,这个网站绝对是您的第一选择。