一个搜索框多个按钮_用一个搜索框搜索所有数据库——生物医学搜索导航1.0版本,欢迎拍砖~...

39309d91a14629ebde1c8514307f459c.png

长久以来,我在做文献调研的时候常常面临一个痛苦的问题——当我需要查一个靶点的信息的时候:

我可能需要先分别从书签栏或者地址栏里找出来Uniprot、PDB、BindingDB、Drugbank、guidetopharmacology、Ensembl……等等网站;

然后在他们的搜索栏中一个个输入我的蛋白名字;

最后分别点击搜索,查看想要的结果。

这个过程不仅耗时间,而且常常会在搜索之中忘记上面众多项目中的其中一部分……

于是就出现了如下对话: 导师:这个蛋白有四个亚型啊,在不同的组织中表达,合作者问我们是哪一个??? 你:……???

于是,我们的生物医学搜索导航1.0就应运而生了!

Biodatabase_Search 生物医学搜索导航1.0

https://bio-lin-187cad-1302119316.tcloudbaseapp.com/ComBio-CN.html

点击上方超链接访问1.0版本

http://biodb.online/index.html

正在内测的2.0版本,主要是跟进了下方展示的标签可调的问题以及大幅度的页面优化。

2020.08.06更新:现在的2.0已经跟1.0几乎截然不同了,各位小伙伴们还是直接用2.0吧

4a00e62e2e766bb027f9b16f3064f3be.png

通过这个标签页(你可以将它固定在你的浏览器上或者设为主页),你可以访问到一些常用的生物医学数据库(你也可以点击下方邮箱给我发邮件让我来添加你常用的网站),使用你感兴趣的关键词在这些不同数据库中搜索:

64e504e5b706172608d35cb126bbcdf7.png
网页的功能是通过模仿搜索所产生的url链接来实现的,如果你感兴趣,可以直接右键查看网页源代码,原理非常简单,因此即使你对前端网页编写不是很了解但想加入进来,这个项目是几乎没有门槛的~

左侧的标签主要是各种常用的数据库,通过在上方的搜索框中输入关键词,点击下方的图片标签就可以搜索了,数据库主要有下面的这些:

1d76f282f5f22f3a258e3765f8acec4c.png

第一个栏目主要是PubMed、Wikipedia和谷歌学术,分别用于查找文献和专业名词,当然,1.0版本还加入了Science Direct来补充实现一些功能(当你无法访问谷歌学术和维基百科时)。

0528d7fdbce204c1c759b66e965c9c32.png

第二个栏目是关于药物设计,包括了主要的带注释的Pubchem数据库(你可以从这里用一个化合物的俗名来获取这个化合物的CAS号、化合物结构、物理化学性质、生物医学相关文献信息),第二个是DrugBank数据库,从这里可以查看一些实验性的、正在临床的以及上市药物的信息,尤其是关于其靶点的信息,第三个BindingDB则偏重于化合物-靶点的亲和力数据,一般用于查看药物的靶点和靶点的药物都有哪些,但是其详细程度和清晰程度均不如第四个Guide to PH药理学网站【真不是我黑它(狗头)】,这个网站尤其适合查看一个靶点有哪些在研药物,这些化合物对同家族的其他蛋白的选择性,以及是否有复合物结构,是否是天然产物,是否上市以及其亲和力数据等等信息,非常详尽。

0fa19727b6e77cd72bf2a15b953fdb4a.png

接下来是几个蛋白质相关信息的数据库,其实相关的数据库还有很多很多,但是因为版面有限只放了最最最常用的几个,第一行的Uniprot和RCSB PDB不用多说,前者是最主要的蛋白质注释信息数据库,后者是PDB数据库中用的人最多的,而剩下的三个可能也被大家熟知,分别是EBI的蛋白相互作用数据库IntAct,两个蛋白质家族数据库Pfam和InterPro(一般用这两个来查看蛋白质的domain信息)。

可能下面的蛋白表达信息数据库可能较少有人知,第一个OPM数据库是一个膜蛋白的数据库,主要功能是告诉我们膜蛋白的结构中膜应该在哪里,在分析和模拟蛋白结构的时候可能有用。剩下的四个放在这里均主要用于检索蛋白质的表达分布和表达水平(但这四个数据库其实各有各的功能),因为并非做这方面的我也不是特别清楚到底哪一个更好,比较推荐中间的Genevisible和最后面的GTEx(GTEx本身的可视化功能不是特别好,但通过GTEx可以访问到前面的Ensembl和其他的几个基因组数据库并直接抵达蛋白质表达水平页面。)

682f3e8d9fbb6f0c3d7e6eabee635a88.png

生化相关的数据库主要看KEGG,但是偶尔也会用到剩下的这几个,比如人类代谢物HMDB就包含了很多人类自身代谢、药物代谢、食物代谢以及环境污染物代谢的信息,同样这方面我也不是特别了解,如果有其他的数据库欢迎各位小伙伴邮件给我推荐!


此外,为了丰富网站的功能,免去从书签中寻找一些常用生信或计算Server的麻烦,我还做了右边的这个cloumn来存放一些在线工具和经常需要打开的网页,希望能够减少浪费在找网站上的时间。这些Server包括了常用的序列比对工具,蛋白质建模工具以及药物靶点研究的工具,这里面特地加入了一些非常有用的Maping和批量下载的工具——比如将BLAST得到的序列的Accession ID转换到Uniprot或者KEGG等其他网站,又比如批量下载从Pubchem找到的感兴趣的小分子的信息。

59edede860c0790961ac93557e38ba65.png
可以使用ID MAP来进行不同数据库间ID的转换

647273fae01b01a009728618d9b757fe.png
搜库工具Blast和HHpred,多序列比对MAFFT及其可视化Weblogo,以及最后的Motif查询

除了上面两行常用的生信方面的工具以外,还加入了药物研发、分子对接和蛋白质建模三个板块的一些常用链接

d94b0fb7e67c479a5f9bb3d7ef825a65.png
小分子的ADMET性质预测、靶标垂钓、蛋白的药物结合口袋预测以及蛋白-配体复合物亲和力预测

b842d347ef463ab8a7c9551a6990d940.png
几种不同的建模方式,对于一个未知的蛋白,推荐用前四个都分别试试~

863ae7994eb116db18845c66a39e192d.png
放在这里的主要是蛋白-蛋白或者蛋白-肽对接工具

当你拿到一个基因/蛋白要开始你的项目时,不妨用上面的这些工具来进行一下分析~

3c82be813855843ad4b4f0f5d9432058.png

有一些可以使用简单的JavaScript制作的简单小工具我也会尽量加到网站上,比如批量下载PDB的功能,最常用的场景可能是在PDB中找到的一堆蛋白,当你想全部下载的时候,可以将搜索页设置为Gallery模式,然后复制这些所有的PDB ID,放到搜索框里点击下方的“批量下载PDB”就可以一键下载了(这个功能调用了PDB自身的批量下载方法,不需要担心频繁访问带来的问题)。

8553bc04bc7ad55cb27a9d05c78be5f4.png

对于初学者,每一个网站或工具都通过浮动提示的方式提示了常用的功能和介绍,这些介绍会逐步完善,尤其是当有人问我这些网站的使用的问题的时候(让我知道有什么标签可以简短地帮助到网站的使用者)。

如果你有其他时常需要用到的基于url访问的小功能(或者其他我能实现的,仅限对生物医学方向有意义的),也可以联系我加到网页上~

如果你对这个长期的Project感兴趣或者想要寻找志同道合的小伙伴,网站下方的二维码问卷和QQ群(群号:1136682465)或许可能帮助到你。

https://qm.qq.com/cgi-bin/qm/qr?k=BkwF6uWjjFjMEAJ3ev59hOGIR5SypOjC&authKey=bAhDkMB78RFHn8x2i2Wi6A00pFTmG+sEe/gwPIq0tTjMyODXV/YICRSq+vebEahV&noverify=0 (二维码自动识别)

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值