文章地址:https://academic.oup.com/bioinformatics/article/36/10/3242/5756209
Github地址:https://github.com/SAMtoBAM/MUMandCo
软件下载安装:
git clone https://github.com/SAMtoBAM/MUMandCo.git
NOTE: 软件是用shell语言写的,没有封装也不需要安装,可以直接使用。
先用自带的数据进行测试(yeast_DEL100_test
目录下):
bash mumandco_v3.7.sh -r ./yeast.tidy.fa -q ./yeast_tidy_DEL100.fa -g 12500000 -o DEL100_test
NOTE: 一定要用bash,用sh会出错。
全部参数如下:
-r or --reference_genome path to reference genome
-q or --query_genome path to query genome
-g or --genome_size size of genome
-o or --output output prefix
NOTE: 基因组大小填写ref与qry中较大的一个就可以。
亲测:在我自的分析数据中,使用mumandco_v3.7.sh 3.7版本会报如下错:
ERROR: Could not parse delta file, Poncirus-trifoliata_query.delta
因此,我试用了较老的版本mumandco_v2.4.2.sh,结果正常运行。
bash mumandco_v2.4.2.sh -r ./yeast.tidy.fa -q ./yeast_tidy_DEL100.fa -g 12500000 -o DEL100_test
结果输出主要在两个文件中:*.summary.txt
Poncirus-trifoliata
Total_SVs 5259
Deletions 2496
Insertions 2590
Duplications 29
Inversions 82
Translocations 62
和*.SVs_all.tsv文件
ref_chr query_chr ref_start ref_stop size SV_type query_start query_stop
chr1 chr7 36915 4736656 4699741 transloc 1421970 4909599
chr1 chr7 49157 50379 1222 deletion 1433841 1434439 complicated
chr1 chr7 84953 102484 17531 deletion 1465285 1491455 complicated
chr1 chr7 84953 102484 26170 insertion 1465285 1491455 complicated
chr1 chr7 109567 2042549 35204 insertion 1498532 1533736
chr1 chr7 2060856 2084706 23850 deletion 1551876 1595127 complicated
chr1 chr7 2060856 2084706 43251 insertion 1551876 1595127 complicated
chr1 chr7 2093656 2146515 37377 insertion 1603294 1640671 complicated
chr1 chr7 2093656 2146515 52859 deletion 1603294 1640671 complicated
chr1 chr7 2150719 2169006 18287 deletion 1644883 2543061 complicated
chr1 chr7 2234230 3195198 960968 inversion 2608048 2819300
chr1 chr7 3197333 3603446 406113 inversion 2821406 3707067