一、生信的两个大类研究方向:
目录
前者偏理论,后者偏向证明
第一类研究方向:
第一类的生物信息学应用关注于中心法则中任一阶段的信息传递,包括DNA序列中基因的组织与控制、确定DNA中的转录单位、从序列预测蛋白质结构以及分子功能分析。
第二类研究方向:
提出关于生物学活动的假设,设计实验以验证这些假设,评估结果与假设的兼容性,然后根据实验数据对原假设作扩展或修正。第二类的生物信息学应用关注于这一流程中的信息传递,包括产生假设、设计实验、通过数据库将实验结果组织起来、检验数据与模型的兼容性以及修正假设的各个系统。
二、具体的研究方向
1、序列分析
方向:分析一群相关蛋白质时,很有必要了解比对的正确构成。发展用于多序列比对的程序是一个很有活力的研究领域,绝大多数方法都是基于渐进比对(progressive alignment)的概念。渐进比对的思想依赖于用户用作比对的蛋白质序列之间确实存在的生物学上的或者更准确地说是系统发生学上的相互关联。
目的:人们并不只是着眼于某一个蛋白,而是研究一个家族中的相关蛋白,看看进化压力和生物秩序如何结合起来创造出新的具有虽然不同但是功能相关的蛋白。研究完多序列比对中的高度保守区域,我们可以对蛋白质的整个结构进行预测,并且猜测这些保守区域对于维持三维结构的重要性。
2、计算进化生物学
目的:
- 通过度量DNA序列的改变研究众多生物体间的进化关系(超越了以前基于身体和生理特征观察的研究方法)
- 通过整个基因组的比对,研究更为复杂的进化论课题,如基因复制,基因横向迁移等
- 为种群进化建立复杂的计算模型,以预测种群随时间的演化[4]
- 保存大量物种的遗传信息
3、生物多样性的度量
方向:对一个特定的生态系统,小到一层生物膜、一滴海水、一铲泥土,大到整个地球,其中全体物种的基因组成分可被定义为这个生态系统的生物多样性。搜集各物种的名称、描述、分布、遗传信息、地位、种群大小、栖息地,和各生物体间的相互作用等信息,可以建立一个数据库。有专门的软件用于搜寻、分析和可视化这些信息,更重要的是,它们还能够帮助人们相互交流这些信息。计算机能够模拟相应的模型,以计算种群动态演变,遗传健康状态等等
目的:该领域的一个重要前景是为濒危物种建立基因银行,即将各物种的基因组信息保存下来。这样即便在将来这些物种灭绝了,人类也可能利用它们的基因组信息重新创造出它们。
4、蛋白质结构预测
原因:在蛋白质的原生环境中,其结构由它的氨基酸序列唯一的决定。蛋白质的结构对于理解蛋白质的功能十分重要。这些结构信息通常被称为二级、三级、四级结构。目前尚没有普遍可行方案实现这些结构的准确预测;大多数方案为启发式的。
方向与目的(案例说明):人类血色素和豆类血色素间的相似性是以上方法的一个实例。两种血色素有相同的功能,均能够在各自的生物体内运输氧气。尽管它们的氨基酸序列大不相同,它们的蛋白质结构几乎一样。
5、蛋白质表达分析
方向:通过蛋白质微阵列技术或高通量质谱分析对生物标本进行测量所获得的数据中,包含有大量生物标本内蛋白质的信息。
目的:生物信息学将所获得的大量质谱数据与通过已知蛋白质数据库预测的数据进行比较,并使用复杂的统计学方法进一步分析
6、比较基因组学
方向:比较基因组学的核心课题是识别和建立不同生物体的基因或其他基因组特征的联系。这些跨基因组的联系使得我们能够跟踪基因组的进化过程。基因组进化由多个不同层次的事件完成。在最低的层次,单个核苷酸上发生了点变异。在较高的层次,大的染色体片段经历了复制、横向迁移、逆转、调换、删除和插入等过程。在最高的层次上,整个基因组会经历杂交、倍交、内共生等变异,并迅速产生新的物种。
7、导致癌症的突变分析
目的:生物信息学家更快、更便宜地对癌症基因组进行测序。二代测序使得分类基因组里导致癌症的突变的流程变得更灵活,也使得透过为不同时间的样本测序,追踪癌症病人的病况演进的检测手段在未来成为可能
8、在药物研发方面的应用
目的:生物信息学可用于药物靶标基因的发现和验证。有许多数据库可用来获得在不同组织在正常/疾病状态下基因表达的差异,通过搜索这些数据库,可以得到候选基因作为药物靶标,特异性地针对某一种疾病。另外,还可根据蛋白质功能区和三维结构的预测来对药物靶标进行鉴定,以便早期了解所研究蛋白的属性,预测它是否适用于药物作用。