生物笔记——注解(一)

生物笔记——注解(一)


前言

在这一系列文章中,主要是对相对应的生信分析篇的博文中的生物知识进行注解。以巩固生物知识。(故主要是以笔记为主,排版会较粗糙),本章为 实验篇——基因家族成员鉴定(一) 的注解

一、注解()

1. CDS序列

CDS(Coding Sequence)序列是指基因的编码区域,包含用于合成蛋白质的DNA序列。
CDS序列是基因组中的一部分,经过转录和剪接以产生成熟的mRNA分子,然后通过翻译过程转化为具有特定功能的蛋白质。

2. Fasta/fa格式

文件的内容包含了一个或多个序列的描述信息和对应的序列数据。
每个序列的描述信息通常以">"符号开头,并在该符号后面跟随描述本身。
紧接着是序列数据,可以是一行长字符串或被换行符分割成多个部分

3. GFF3/GTF格式

GFF3和GTF格式都是文本文件格式,用于记录基因和转录本相关的注释信息。
它们提供了一种标准化的方式来表示基因的位置、外显子和内含子的边界、转录本的起始和终止位置,
以及其他与基因结构和功能相关的信息,如启动子、UTR(非翻译区域)和CDS(编码区域)等。

而GB 文件除了包含基因组特征的位置和注释信息外,还包括基因组序列的碱基序列

4. BLAST

BLAST (Basic Local Alignment Search Tool)是一种用于比对生物序列的工具,它可以在数据库中搜索相似的序列。
BLAST有多个版本和变体,包括BLASTP(蛋白质对蛋白质的比对)、BLASTN(核酸对核酸的比对)、BLASTX(核酸对蛋白质的比对)等.
工作原理是通过将查询序列与数据库中的序列进行比对,找到最佳的匹配。
它使用了一种称为“快速查找”的算法,该算法可以快速地在数据库中找到与查询序列相似的序列。

5. SMART

SMART(Simple Modular Architecture Research Tool)是一个用于蛋白质结构和功能预测的在线工具和数据库。它通过分析蛋白质序列中的保守结构域和模块来推断蛋白质的功能和结构。
SMART数据库中包含了大量已知的蛋白质家族和结构域的信息,这些家族和结构域在不同的蛋白质中起着相似的功能。通过比对待分析的蛋白质序列和SMART数据库中的信息,可以预测蛋白质的功能、结构和可能的相互作用。

6. 基因家族成员鉴定

基因家族成员鉴定是指通过比对和聚类分析来识别具有相似序列或功能的基因。
基因家族是指在基因组中存在多个拥有相似序列或功能的基因。这些基因通常由基因复制、基因重组或基因转座等机制产生,形成一个基因家族。

7. 参考序列

参考序列(Reference sequence)是在基因组学和生物信息学研究中使用的一种基准序列,用于与其他样本或序列进行比对和分析。参考序列通常是一个代表性的、经过确认和注释的基因组或转录组序列。

参考序列可以是某个物种的整个基因组序列,也可以是某个特定区域(如染色体、基因)的序列。这些参考序列通常是高质量的、较完整的序列,经过多个实验室的研究验证,并进行了注释和标准化处理。

使用参考序列可以帮助研究人员对新测序数据进行比对和分析,从而确定新测序片段的位置、变异情况和功能等。通过与参考序列的比对,可以确定DNA片段的起始和终止位置,预测基因和CDS序列,识别基因组变异和单核苷酸多态性等。

在某些情况下,参考序列也可以用来表示氨基酸序列。例如,在使用BLAST(Basic Local Alignment Search Tool)等序列比对工具时,可以使用已知的蛋白质氨基酸序列作为参考序列来比对新测序得到的氨基酸序列,以确定其相关性或相似性。但在这种情况下,通常会明确指出参考序列为氨基酸序列,以区别于DNA或RNA序列的参考序列。

8. KEGG

KEGG(Kyoto Encyclopedia of Genes and Genomes)是一个集成了基因组、基因、蛋白质、代谢通路、疾病和药物等多个生物信息资源的数据库和知识库。它提供了对生物系统功能和组织学上的全面理解,并为基因功能注释、代谢通路分析、疾病研究和药物开发等领域提供了重要的参考资料。
可以帮助研究者理解基因的功能和调控机制,探索代谢通路的调节和研究疾病的发病机理。同时,KEGG数据库的数据更新和补充也为科研人员提供了最新的生物信息.资源和研究工具

9. pep格式

PEP格式是一种用于表示蛋白质序列的文本格式。PEP表示"Protein Encoding Sequence",常用于存储和共享蛋白质序列信息。

10. 结构域

结构域(Domain)是指蛋白质分子中具有相对独立的结构和功能的一部分。结构域可以包含一个或多个连续的氨基酸序列,在三维空间中形成特定的结构。结构域在蛋白质中具有特定的功能,如结合其他分子、催化化学反应等。
结构域的发现和研究对于理解蛋白质的功能和进化有重要意义。通过对不同蛋白质中结构域的序列和结构比较,可以揭示蛋白质的进化关系和功能的起源。此外,结构域也为蛋白质工程和药物设计提供了重要的依据,通过对结构域的改变和调控,可以调整蛋白质的功能和特性。


总结

在生物这条道路上,我也只是一个学徒,有许多知识等着我去学习,而我也希望一这种方式促进我的学习。ok,笔记总结完毕。
不以物喜,不以己悲

–时23年7月15日 笔记篇

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

星石传说

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值