生信小知识 | 如何快速确定一个物种某一个基因家族全部基因数目

公众号:生信漫谈,获取最新科研信息!

生信小知识 | 如何快速确定一个物种某一个基因家族全部基因数目icon-default.png?t=N7T8https://mp.weixin.qq.com/s?__biz=MzkwNjQyNTUwMw==&mid=2247486827&idx=1&sn=9fea85f8d28af3e02570235936a1f535&chksm=c0e9e89bf79e618db88f549920976231aef58297f59c6f25b2856e73c2a414e2947869ff9523&token=918065009&lang=zh_CN#rd

图片

不断有小伙伴留言咨询如何快速确定一个物种某一个基因家族全部基因数目,那么我们需要用到pfam号去构建HMM(隐马尔可夫模型)文件。

那么我们怎么首先知道我们的基因家族的pfam号呢?今天,我将从基因家族pfam号文件,在对基因家族序列分析出发带大家快速入门了解一个基因家族。

pfam号查找01

发表的文献

一般基因家族的文献中会在方法中进行介绍,现在我们看一篇最近发表的基因家族相关的文献中的方法。

图片

是不是非常清楚明了,如果是已经发表的可以直接参考借用就行。

图片

02基因组数据库中获得

下面以水稻Cytochrome P450基因LOC_Os03g04530为例来查找pfam号。

图片

是不是非常清晰明了,方便非常,一看就懂!

03

pfam网站查找

https://www.ebi.ac.uk/interpro/search/sequence/

图片

直接点击Search进行查找pfam号就行,点击下面结果进行下一步。

我们在代表性结构域哪里直接看到p450的pfam号是PF00067,可以直接点进去下一步。

如下图所示:

图片

直接点击红色框框出现如下图所示界面直接下载即可。

下载的HMM文件直接解压就是HMM结构文件了,但是有点需要注意的是hmm文件里HMMER3/f要换成HMMER3/b才能正常使用。

图片

基因家族数目

01hmmsearch获取基因家族基因

前面已经得到了HMM模型文件了,下面可以直接用linux服务器直接输入代码一键获得大致的基因家族数目。

#先安装hmmer软件
conda install -c bioconda hmmer
#直接输入下面代码得到结果
hmmsearch PF00067.hmm Os.pep.fasta > p450_domain.txt

上面得到了hmmsearch-evalue:默认1e-05,小于这个数值的基因家族成员,提取目标基因的蛋白序列。

可以用tbtools软件快速提取,非常方便,省心省力。

图片

或者在linux服务器用代码提取,也超简单方便,代码如下,需要的可以记录一下。

#先安装seqtk软件
git clone https://github.com/lh3/seqtk
    cd seqtk
    make   
#或者直接用conda安装即可
conda install -c bioconda seqtk
#直接输入下面代码得到结果
seqtk subseq Os.pep.fasta id.txt> p450-pep.fa

02cdd保守结构域分析

https://www.ncbi.nlm.nih.gov/Structure/bwrpsb/bwrpsb.cgi

打开网页如下图所示,

图片

可以查询到这些目的基因属于p450基因家族了。

图片

小伙伴们,是不是超级方便,导师再问你这个基因家族有多少基因啊,你应该知道怎么去查找了吧,学会了吗?学会了不要忘了转发朋友圈,点赞点赞噢!

 回顾往期内容

1、生物博士这些研究网站建议收藏

2、生物博士互作蛋白研究收藏网站汇总

3、Cell文章教你怎么找互作蛋白

4、超简单的比较基因组学Ka/Ks进化速率图绘制

5、超详细非模式物种GO数据库全新代码构建

6、生物研究的一些常用在线生信工具建议收藏

7、植物基因的时空表达及胁迫处理可视化网站

8、生信小白送你超好用分子克隆工具SnapGene

9、三个团队三个故事,一个基因连续三年发表三篇高水平文章

10、从西湖大学柴大教授看当代博士研究生的自我突围

11、如果浙江大学李兰娟院士在MDPI杂志发表的SCI论文结果不能复现,会怎么样?

12、为什么浙江大学李兰娟院士选择在MDPI杂志发表SCI论文

13、施一公为什么没有推荐颜宁/柴继杰成院士候选人,李兰娟推荐了谁?

14、顶尖学者纷纷加入西湖大学,颜宁什么时候加入施一公团队

15、由万建民院士Cell论文引起的一点思考和疑惑

16、清华大学施一公团队为什么选择《International Journal of Molecular Sciences》发表SCI

17、西湖大学施一公团队在国际著名杂志IJMS发表重要论文给予我们的启示

18、可以在施一公团队投稿的《International Journal of Molecular Sciences》上发表文章吗?

通过以上步骤是否学会了呢?关注我们,学习更多生信干货,原创不易,请各位多多点赞加转发朋友圈进行分享!

今天就先给大家介绍到这里,希望大家的科研能有所帮助!祝您科研顺利快乐!

生信漫谈

生信漫谈,认识生信,学习生信,跨越生信入门路上的障碍,从而利用生信技术解决科研学习路上的绊脚石!

  • 12
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
项目:– JavaScript 中的患者数据管理系统 患者数据管理系统是为医院开发的 node JS 项目。通过使用此系统,您可以轻松访问患者数据,它具有成本效益,可改善患者护理和数据安全性。不仅如此,它还减少了错误范围。在运行项目之前,您需要下载 node.js。 这个患者数据管理项目包含 javascript、node.js 和 CSS。我们必须让服务器监听端口 3000,并使用 JSON 在客户端和服务器之间交换数据。这个项目会不断询问您有关插件更新的信息,因此请保持互联网畅通。此系统允许您执行 crud 操作。在这里,您是系统的管理员。您还可以添加所需的员工人数。此外,您还可以更新患者记录。该系统功能齐全且功能齐全。 要运行此项目,您需要在计算机上安装NodeJS并使用现代浏览器,例如 Google Chrome、  Mozilla Firefox。ReactJS项目中的此项目可免费下载源代码。有关项目演示,请查看下面的图像滑块。 对于手动安装 1.将主项目文件夹解压到任意目录 2.从 cmd 设置项目目录的路径 3. 输入命令“npm install” 4.完成后输入命令“npm start” 5.现在,您将获得一个 localhost:portnumber,并转到该 URL 演示: 该项目为国外大神项目,可以作为毕业设计的项目,也可以作为大作业项目,不用担心代码重复,设计重复等,如果需要对项目进行修改,需要具备一定基础知识。 注意:如果装有360等杀毒软件,可能会出现误报的情况,源码本身并无病毒,使用源码时可以关闭360,或者添加信任。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值