Paper reading series -1
简介
在生物医学研究中,一些名称会随着时间发生变化,并且生物实体通常会有很多别名,另外还有一些未被命名的数据也需要准确区分。因此在各类生物医学数据库中,使用唯一ID表示数据非常重要。为了整合分析多个数据库的内容,ID转换非常有必要。比如将RefGene ID与Ensemble ID对应起来。
全面且准确的ID转换并不容易实现。这需要在数量和数据量都在不断增长的生命科学领域数据库中,准确提取并不断更新各个源数据库中的ID之间的关系。如果有一个方便可用的API,web应用开发可节省大量人力时间,且可帮助科研工作减少时间投入。
现有ID转换工具存在支持的数据库范围有限,难以加入新的ID转换,对应ID的生物意义不清晰,不提供可用API等问题。TogoID项目通过扩大数据库范围,定义本体明确描述ID之间关系,基于云托管的数据定期更新,构建了友好的web界面和API,满足了ID转换的各类需求。
支持的数据库
包含基因,转录本,蛋白,结构,化合物,信号通路,疾病和文献等48个数据库。但由于数据库ID形式多样,为了便于整合,切分为65个子数据库。