基因家族分析

基因家族成员筛选与分析

基因家族

基因家族是来源于同一个祖先,由一个基因通过基因重复而产生两个或更多的拷贝而构成的一组基因,它们在结构和功能上具有明显的相似性,编码相似的蛋白质产物。

研究基因家族的意义

  • 基因家族的基因在物种之间都是比较保守的,通过基因家族分析可以得到某物种特有的家族基因,而这些基因则有可能与该物种的特异性有关。(筛选)
  • 通过对多物种构建系统发育树,从而得到物种起源进化或亲缘关系方面的信息,并为后续遗传操作提供参考。(进化树)
  • 通过分析家族基因在进化过程受到的正向选择,确定与该物种环境适应性相关的基因。(Ka/Ks)

主要工具:TBtools (https://www.sciencedirect.com/science/article/pii/S1674205220301878)

在这里插入图片描述

TBtools下载及安装

https://tbtools.cowtransfer.com/s/0a9cbf41b47b4a
在这里入图片描述

1. 数据库下载

1.1 EnsemblPlants (http://plants.ensembl.org/info/data/ftp/index.html)

在这里插入图
在这里插入图片描述

1.2 Phytozome 13 (https://phytozome-next.jgi.doe.gov/)

在这里插图片描述
在这里插入图片描述在这里插入图片描述
在这里插入图片描述
在这里插入图片描述在这里插入图片描述在这里插入图片描述

2. 去除可变剪切

在这插入片描述

3. 隐马尔可夫模型 (HMM: Hidden Markov Model)

HMM(隐马尔可夫模型) 是一种统计模型,从可观察的参数中确定该过程的隐含参数,然后利用这些参数来作进一步的分析。
https://www.ebi.ac.uk/interpro/entry/pfam/#table
在这入图片描述

4. 基因家族成员筛选

4.1 利用HMM进行筛选

在这里插图片描述
在这里插图片描述

fasta序列提取

在这里插入图片描述在这里插入图片描述

4.2 本地blast筛选

4.2.1 下载:https://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST/

在这里插入图片描述

4.2.2 安装

在这里插入图片描述

4.2.3 用户环境变量设置

此电脑-属性-高级系统设置-环境变量

在这里插入图片描述在用户变量下方:新建-变量名:balstdb,变量值为电脑安装好新建的db文件夹的路径
在这里插入图片描述
在系统变量下方:Path-添加变量值为电脑上bin文件夹位置
在这里插入图片描述

4.2.4 本地blast筛选

将整理好的蛋白组数据(fasta)放入到db文件夹中,在Windows PowerShell中运行以下代码:

#第一步,格式化数据库
makeblastdb.exe  -in Gmax_275_Wm82.a2.v1.protein.Repre.fa -parse_seqids -hash_index -dbtype prot

在db文件夹下创建target.txt的文本文件,将用来blast的fasta序列放入
在这里插入图片描述
在db 文件夹下创建out.txt的文本文件,用于记录blast结果

blastp.exe -task blastp -query target.txt -db Gmax_275_Wm82.a2.v1.protein.Repre.fa -out out.txt -evalue 1e-10 -outfmt 6 -num_threads 2

在这里插入图片描述
合并HMM结果和blast结果,提取fasta序列,用于后续分析。

5. 结构与预测

5.1 SMART

http://smart.embl-heidelberg.de/smart/set_mode.cgi?NORMAL=1
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

5.2 CDD

https://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi
在这里插入图片描述
在这里插入图片描述在这里插入图片描述在这里插入图片描述

6. 结构域可视化

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

6. 系统发育进化树

在这里插入图片描述

6.1 工具:MEGA

https://megasoftware.net/

6.1.1 构建进化树

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

6.1.2 进化树可视化

在这里插入图片描述
在这里插入图片描述

  • 33
    点赞
  • 36
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
  本工具用ARX+LISP编程,用于解决当前 AutoCAD 绘图中的一些不足或不便,提高绘图的效率,并将日常积累的一些程序整理成集,以方便使用。主要功能有:选择集管理、快速选择、各种刷子、批量修改块属性、断线、表格与EXCEL的导入导出、绘图命令与图层关联、绘制图案填充的边界、数字运算(编号、标高等)、编号、过滤重叠对象、原位修改文字的对齐方式、检查系统变量等100多项功能。已支持至目前最新的AutoCAD2020。   最大的亮点1--侧边菜单栏。类似天正、理正的菜单栏操作方便简洁,鼠标停留时出现菜单功能提示,可自定义菜单、菜单标题、各级菜单背景颜色等。可轻松使用本菜单调用自己编写或收集的各种LISP命令。  亮点2--批量打印(通用版):   1.自动识别图框,支持模型和全部布局空间。会过滤重叠的图框。   2.自动选择合适的纸张尺寸,且可指定选择的纸张尺寸范围。   3.从图签读取比例,对模型和布局有不同的比例控制(习惯上布局出图常为1:1)。   4.支持布满图纸打印和打印缩放。   5.支持多种打印排序规则,方便纸版图纸的分类和整理。   6.支持多种存放路径的规则,自动完成电子版图纸的分类存放。如:有多个子项时,可按子项分类存放。   7.支持多种文件命名的规则,自动完成电子版图纸的文件命名。如:按“图号 图名”命名打印的PDF文件。   其它亮点:1.我自己使用频率最高的快速选择,2、编号及批量修改,3、文字内容等刷子,4、批量修改图层颜色,5、修改外部参照路径......
Linux基因家族分析是指对Linux操作系统的源代码进行分析和研究,以了解其演化历史、内部结构、功能特性和开发流程等方面的信息。 Linux是一个开源操作系统,其源代码是公开的,每个人都可以查看、学习和修改。这为研究人员提供了一个独特的机会,可以深入探索Linux系统的底层原理和设计。 首先,分析Linux基因家族可以了解Linux操作系统的演化历史。通过研究Linux不同版本的源代码,我们可以追踪和了解Linux系统的发展过程,从最早的版本到当前的最新版本,逐步了解它的变迁和发展。 其次,分析Linux基因家族有助于了解Linux系统的内部结构和组织方式。Linux是一个模块化的系统,它由许多不同的模块组成,每个模块负责不同的功能。通过分析和研究这些模块之间的关系和交互方式,我们可以深入了解Linux系统的内在机制和工作原理。 此外,分析Linux基因家族还可以揭示Linux系统的特色功能和创新点。在源代码中,我们可以找到许多独特的特性和功能实现,这些特性往往体现了Linux系统的创新和灵活性。通过研究这些特性的实现方式和技术原理,我们可以了解到Linux在各个方面的优势和特色。 最后,分析Linux基因家族还可以深入了解Linux社区的开发流程和文化。Linux作为一个开源项目,依靠全球范围内的开发者和用户共同推进和维护。通过研究Linux社区的合作方式、软件开发流程和代码审查机制等方面的信息,我们可以了解到Linux社区的协作精神和开发理念。 因此,通过对Linux基因家族分析,我们可以从不同的角度深入了解Linux操作系统,揭示其演化历史、内部结构、特色功能和开发流程,为Linux的进一步研究和应用提供重要的参考和指导。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值