28.2 Gb基因组SSR序列知多少:Misa+Primer3流程

前两天帮人下载了28.2Gb的蝾螈基因组GCA_002915635.3 ,这么大的基因组,还是第一次近距离接触。

由于之前我优化了下Misa+Primer3 流程脚本,使之可以耗费较小的服务器资源用于分析核心基因组SSR并设计引物。目前为止,我接过的付费分析中还没有超过3Gb的基因组,因此,萌生了对蝾螈基因组分析SSR并设计引物的想法。

就现在网上公开的脚本和修改方法,并不能直接完美将Misa+Primer3 流程应用于核心基因组的分析。如果你有需要分析的,可以直接联系我做付费分析。

流程bash脚本

  • 脚本名称run_ssr.sh
  • 输入文件为fasta序列,非压缩文件
  • 先对fasta序列进行备份儿,加前缀bak_
  • fasta序列ID部分空格后的内容需要先删掉。
$ cat run_ssr.sh
#!/usr/bin/env bash

usage() {
   
cat << EOF
Function: Misa + Primer3
Usage:  bash `basename $0` <fasta file> 
e.g. bash `basename $0` test.fasta
EOF
    exit 1
}

[[ $# == 1 ]] || usage

FASTA=$1

[[ -f bak_${FASTA} ]] || cp ${FASTA} bak_${FASTA} 

sed -i 's/ .*//g' $FASTA

echo "----misa.pl `date`----"
perl misa.pl 
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值