1. Bamsurgeon简介
将基因组变异(SNV、INDEL和SV)添加到SAM/BAM/CRAM文件的工具(addsnv.py、addindel.py和addsv.py),用于测试变异分析程序。
2. Bamsurgeon安装
依赖于wgsim和samtools,比对工具bwa(同时支持其他比对工具,如novoalign, gsnap, bowtie2, and tmap),python(本人版本为3.9)。
wgsim安装参考文章:生信软件33 - Wgsim生成双端(PE) fastq模拟数据
# 推荐使用conda安装samtools
conda install samtools -y
conda install bwa -y
# Pysam python库
pip install pysam
# picard
wget https://github.com/broadinstitute/picard/releases/download/1.131/picard-tools-1.131.zip
unzip picard-tools-1.131.zip
# Exonerate
git clone https://github.com/adamewing/exonerate.git
cd exonerate
git checkout v2.4.0
autoreconf -i
./configure && make && make check && make install
# Velvet
git clone https://github.com/dzerbino/velvet.git
cd velvet
make
cp velvetg $HOME/bin
cp velveth $HOME/bin
########### linux非conda安装 ###########
git clone --recurse-submodules --remote-submodules https://github.com/samtools/htslib.git
make -C htslib
# samtools
git clone https://github.com/samtools/samtools.git
make -C samtools
cp samtools/samtools $HOME/bin
cp samtools/misc/wgsim $HOME/bin
# bwa
git clone https://github.com/lh3/bwa.git
make -C bwa
cp bwa/bwa $HOME/bin
########### linux非conda安装 ###########
3. 检查依赖是否正确安装
Bamsurgeon项目地址: https://github.com/adamewing/bamsurgeon
# clone Bamsurgeon github
git clone https://github.com/adamewing/bamsurgeon.git
cd bamsurgeon
# 检测依赖
python -O scripts/check_dependencies.py
4. 运行示例
# -o bin/addsv.py 脚本路径
# -v 输出插入结构变异文件
# -f 输入bam文件
# -r 输入参考基因组fasta,需构建好bwa索引
# -o 输出插入变异信息的bam文件
# --aligner 比对器,此处bam采用bwa mem工具获得
# --seed 随机种子生存器
# --inslib FASTA文件包含可能的插入库
# bwa索引
bwa index Homo_sapiens_assembly19.fasta
# fasta索引
samtools faidx Homo_sapiens_assembly19.fasta
# 具体参数可以查看python脚本信息
# addindel.py和addsnv.py使用方法类似
python -O bin/addsv.py -p 1 -v test_data/test_sv.txt \
-f test_data/testregion_realign.bam \
-r test_data/Homo_sapiens_chr22_assembly19.fasta \
-o test_data/testregion_sv_mut.bam \
--aligner mem \
--keepsecondary \
--seed 1234 \
--inslib test_data/test_inslib.fa
addsv.py 参数
test_sv.txt 文件
生信软件文章推荐
生信软件1 - 测序下机文件比对结果可视化工具 visNano
生信软件3 - mapping比对bam文件质量评估工具 qualimap
生信软件4 - 拷贝数变异CNV分析软件 WisecondorX
生信软件7 - 多线程并行运行Linux效率工具Parallel
生信软件8 - bedtools进行窗口划分、窗口GC含量、窗口测序深度和窗口SNP统计
生信软件9 - 多公共数据库数据下载软件Kingfisher
生信软件10 - DNA/RNA/蛋白多序列比对图R包ggmsa
生信软件11 - 基于ACMG的CNV注释工具ClassifyCNV
生信软件12 - 基于Symbol和ENTREZID查询基因注释的R包(easyConvert )
生信软件13 - 基于sambamba 窗口reads计数和平均覆盖度统计
生信软件14 - bcftools提取和注释VCF文件关键信息
生信软件15 - 生信NGS数据分析强大的工具集ngs-bits
生信软件17 - 基于fasta文件的捕获探针设计工具catch
生信软件18 - 基于docker部署Web版 Visual Studio Code
生信软件20 - seqkit+awk+sed+grep高级用法技巧合辑
生信软件21 - 多线程拆分NCBI-SRA文件工具pfastq-dump
生信软件22 - 测序数据5‘和3‘端reads修剪工具sickle
生信软件23 - Samtools和GATK去除PCR重复方法汇总
生信软件24 - 查询物种分类学信息和下载基因组TaxonKit和ncbi-genome-download
生信软件26 - BWA-MEM比对算法性能更好的bwa-mem2
生信软件27 - 基于python的基因注释数据查询/检索库mygene
生信软件28 - fastq与bam的reads数量计算与双端fastq配对检测工具fastq-pair
生信软件29 - 三代数据高效映射精确的长读段比对工具mapquik
生信软件31 - Bcftools操作VCF/BCF文件高级用法合集
生信软件33 - Wgsim生成双端(PE) fastq模拟数据