欢迎关注”生信修炼手册”!
NONCODE数据库是一个综合的非编码RNA数据库,该数据库中包含了除tRNA和rRNA之外的其他类型的非编码RNA信息,其中绝大部分是lncRNA,网址如下
http://www.noncode.org/index.php
目前最新版本为v5, 共包含了17个物种的非编码RNA, 物种和对应的lncRNA数量汇总如下
该数据库通过两个途径收集和整理非编码RNA信息,第一种是通过pubmed进行文献检索,以ncrna
, non-coding
等关键词检索,然后从文章中提取非编码RNA;第二种是通过已有的数据库,比如RefSeq
, GENCODE
, lncRNAdb
等。
将收集到的所有非编码RNA以gtf
和bed
格式进行记录,通过compare
合并相同转录本,去冗余,对去冗余只有的转录本和基因赋予NONCODE的ID; 然后利用CNCI
预测其蛋白编码潜能,只保留CNCI
预测结果为non-coding的转录本。
以上可以得到非编码RNA的基本信息,除此之外,还提供了在不同组织或者细胞系中的表达谱,功能预测,在不同物种间的保守性, 相关疾病等注释信息,人类的非编码RNA表达谱从Human BodyMap2.0 项目和