第十章 生物信息数据库及软件资源
10.4 UCSC基因组浏览器
- UCSC Genome Browser
- 感兴趣的蛋白用UCSC browser查一下,获取已知的信息。
- 非常有用的工具:BLAT Search Genome可打包下载至本地使用。
- BLAT和BLAST的区别在与BLAT主要是用于把一个基因或蛋白的序列比对到它自己所在的物种的基因组序列上,而BLAST则经常做的是跨物种的比较,所以BLAST最后找到的可能是另外一个物种的和你这个序列相似性只有20%、30%序列一致性的结果。
- 序列和基因组上的片段很少100%吻合,因为1.测序过程中的错误;2.遗传变异。
- UCSC In-Silico PCR: 给一个比对的基因组,给一对设计好的Primer,它会计算这个Primer的melting temperature,以及forward、reverse等,然后找出来基因组上可能有哪些区域能被这对Primer抓下来。
10.5 其他主要生物信息资源
- 蛋白三维结构数据库 Protein DataBank (PDB): 目前主要由Rutgers和US Sandiego共同来管理。目前共有将近10万的三维结构,包括8万多的X-ray的晶体结构,1万多的核磁结构,还有像Electron Microscopy等一些结构。
- Stanford的GERP,主要是用来计算保守性。给一组蛋白序列,就可以找到这一组序列中最保守的区间。
- Yale的Gerstein Lab的CNVnator,主要是通过新一代测序技术来鉴定拷贝数变异。
- Sanger Institute的Rfam,把已知的很多非编码RNA(非编码RNA也有很多的家族)的家族做了比对和相应的motif分析。如有一个新的非编码RNA,想知道有什么潜在的功能,可以用Rfam做一个预测。
- 小程序包-Bioconductor, 有很多小的R包,若需要编写一个R程序,可以去这里找是否有人写过。
- BioPerl, 有很多Perl的程序包。
- BioPython, 很多Python的包。
- 计算量很大的程序需要用C和C++来写。
10.6 学生介绍CBI资源----CBI Resource Review
1. Genome Analysis and Comparison, 基因组分析和比较
- 主要介绍Rice-Map, CVTree, ColinearScan三种工具
- Rice-Map,水稻基因组和相关资源图谱是在2007年被建立,2012年有更新,在这个数据库中,将已经注释的水稻两个亚种:日本亚种和印度亚种的基因和表观遗传调控信息标记到了水稻的基因组图位上,做成了图谱。在此基础上提供了筛选和标记的功能。
- Composition Vector Tree, 组合向量的数目通过组合向量的方法,不依赖于序列比对,建立起全基因组的植物系统树。CV树方法首先被用于推断微生物之间的进化相关性然后被成功运用到了病毒,绿藻和真菌。这个方法避免了重建植物系统发生关系时,由于选择标准基因时带来的不确定性,避免了比对不同长度和内容的序列。
- ColinearScan通过动态规划算法,分析基因组的共线性,该工具把用于序列比对的动态规划算法运用于基因组共线性的探测中,可以有效预测待测基因组的共线性。
2. Protein Families of Biomedical Signification,生物医药相关的蛋白质家族
- PathLocDB, 是关于新陈代谢途径的亚细胞定位的一个全面的数据库,可以用在多种定位分析中。该数据库被设计为研究代谢途径以及参与代谢的酶亚细胞定位的一个中心工具。
- 数据库有如下功能:基于亚细胞定位和物种搜索来浏览不同的代谢途径;系统比较不同物种代谢途径定位的特征;发现代谢途径的潜在调控机制和可能的定位;基于亚细胞定位弄清代谢通路的边界以及发现不同亚细胞定位之间的中介物联系的机制。
3. Gene Expression Regulation,基因表达调控
- AutismKB, 一个疾病相关的数据库,主要收集了基于六种实验方法找到的和自闭症谱系障碍相关的基因。
- PlantTFDB, 植物转录因子数据库,始于2011,2017有第四版。
4. Bioinformatics Infrastructure,生物信息学基本工具
- ABCGrid,是生物信息学计算网络的应用,适用于小规模的生物学实验室,适用大量不同源的计算资源,并且连接了许多生物信息学应用。该软件通过客户端的主节点连接不同的源节点,该软件的源代码在GNU的GPL许可下发表。
- WebLab是一个整合了多样化工具的多功能生物信息学分析平台,具有统一而对用户友好的外部界面。同时,WebLab不仅仅是一个生物信息学工具箱,它也提供了强大的数据管理功能,集团策略和知识分享机制,可以大大提高工作效率。
- http://www.cbi.pku.edu.cn/research/