生物信息学题目整理：陈润生

最新推荐文章于 2023-10-20 20:40:18 发布

weixin_30762087

最新推荐文章于 2023-10-20 20:40:18 发布

阅读量2.5k

点赞数 1

文章标签：数据库人工智能

原文链接：http://www.cnblogs.com/wangprince2017/p/9238081.html

版权

本文整理了生物信息学的相关知识，包括基因组信息的获取、分析和解释，新基因的发现方法，生物进化的研究步骤与挑战，SNP的重要性和研究网站，以及系统生物学的定义和对生物功能理解的变革。同时讨论了非编码序列、非编码RNA和非编码基因在人类基因组中的比例和作用。此外，概述了表达谱和测序数据分析流程中的标准化和差异表达分析方法。

摘要由CSDN通过智能技术生成

生物信息学题目整理：

陈润生：

一、什么是生物信息学？你怎么理解它的含义？

Genome informatics is a scientific discipline that encompasses all aspects of genome information acquisition, processing, storage, distribution, analysis, and interpretation.

1、生物信息学是一个学科领域，包含着基因组信息的获取、处理、存储、分配、分析和解释的所有方面。

2、生物信息学是把基因组DNA序列信息分析作为源头，破译隐藏在DNA序列中的遗传语言，特别是非编码区的实质；同时在发现了新基因信息之后进行蛋白质空间结构模拟和预测；其本质是识别基因信号。

3、生物信息学的研究目标是揭示“基因组信息结构的复杂性及遗传语言的根本规律”。它是当今自然科学和技术科学领域中“基因组、“信息结构”和“复杂性”这三个重大科学问题的有机结合。

对生物信息学理解的实例：怎样从新测得的DNA序列中找到编码区？非编码区与编码区的差别是什么？非编码区有什么具体功能？RNAi现象对于细胞来说有着很重要的意义，包括基因表达的调控等等，那么都有哪些具体机制可以诱导正常细胞产生RNAi现象？SARS病毒的比较基因组研究；治疗SARS的RNAi设计；SARS蛋白的结构预测和模拟。

怎么理解：

生物信息学是把基因组DNA序列信息分析作为源头，找到基因组序列中代表蛋白质和RNA基因的编码区；同时，阐明基因组中大量存在的非编码区的信息实质，破译隐藏在DNA序列中的遗传语言规律；在此基础上，归纳、整理与基因组遗传信息释放及其调控相关的转录谱和蛋白谱数据，从而认识代谢、发育、分化、进化的规律。

其还利用基因组中编码区信息进行蛋白空间结构模拟和蛋白功能预测，并将此类信息与生物体和生命过程的生理生化信息结合，阐明其分子机理，最终进行蛋白、核酸分子设计、药物设计、个体化医疗保健设计。

二、发现新基因的两种方法是什么？算法的本质是？

大部分新基因是靠理论方法预测出来的。

1、利用NCBI中EST( Expression Sequence Tag) 数据库 (dbEST) 发现新基因和新SNPs。

国际上现已出现了几个基于EST的基因索引如UniGene, Merck-Gene, GenExpress-index

数据来源于大量的序列小片段，EST较短，故关键在正确拼接。方法有基因组序列比对、拼接、组装法等。经常采用SiClone策略

主要步骤：构建数据库；将序列纯化格式标准化；从种子库中取序列和大库序列比对；延长种子序列，至不能再延长；放入contig库

（1）构建若干数据库：总的纯化的EST数据库、种子数据库、载体数据库、杂质、引物数据库、蛋白数据库、cDNA数据库；

（2）用所用种子数据库和杂质、引物数据库及载体数据库比对，去除杂质；

（3）用种子和纯化的EST数据库比对；