自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 基因家族进化分析之DNA序列批量获取

使用方法参考: 基于全基因组的基因家族分析(3):SlNRAMP家族基因CDS和Genomic DNA序列获取Gene序列要获得的ID号不仅仅是seqid,而且还需要在染色体上的位置信息——起始和终止位置,以及染色体编号。这里就需要用到其他两个数据文件了,就是基因组序列(dna)和基因组注释文件(gff3)。思路——首先根据已经获得的ID号从gff文件中获取染色体位置信息,然后再用bedtools工具根据得到的染色体位置信息来获取基因的序列,最终得到基因集。代码如下。#!/bin/bashc=

2021-03-07 17:45:15 2327

原创 基因家族进化分析之CDS批量获取

方法来源https://www.jianshu.com/p/9f96fc7438aa文件名提取方法参考以下。https://my.oschina.net/u/2391658/blog/1927707需要将cds文件和seqid文件放在同一文件夹。#!/bin/bashb=$(ls *.cds)for j in ${b}do cds=`basename ${j} .cds` echo "We have cds files ${cds}" for i in

2021-03-07 13:20:37 1540

原创 基因家族进化分析之HmmerSearch批量处理

‘’’ bash#!/bin/bashmkdir search_outmkdir sequencemkdir protein.hmm文件和pep蛋白文件要放在同一文件夹dir=(ls∗.fa)n=(ls *.fa)n=(ls∗.fa)n=(ls *.hmm)for i in ${dir}; doecho “search *.hmm against ${i}”hmmsearch -o ${i}.hmmout --noali -E 1e-5 ${n} ${i}echo “extract s

2021-03-05 12:27:06 2547

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除