介绍
MCScanX软件包含了两个部分,一个是MCScan算法;另一部分是后期的可视化分析。目前这个软件可以在MAC OS(需要提前安装xcode)和 linux(需要Java SE Develoment Kit和“libpng”)上使用。
核心程序包括:
- MCScanX 检测共线性区域,并比对到参考染色体上。
- MCScanX_h 和MCScanX类似,只不过输入文件是成对的用tab隔开的同源基因。
- duplicate_gene_classifier 基因分类
下游程序:
- detect_collinear_tandem_arrays
- dissect_multiple_alignment
- dot_plotter.java
- dual_synteny_plotter.java
- circle_plotter.java
- bar_plotter.java
10.add_ka_and_ks_to_collinearity.pl
11.group_collinear_genes.pl
12.detect_collinearity_within_gene_families.pl
13.origin_enrichment_analysis.pl
14.family_circle_plotter.java
15.family_tree_plotter.java
安装
$ wget http://chibba.pgml.uga.edu/mcscan2/MCScanX.zip
$ unzip MCScanX.zip
$ cd MCScanX
$ make
$ cd ..
$ sudo mv MCScanX /opt/biosoft/
make blastn.result -4
- 准备两个fa文件,各自建库:
**makeblastdb -in pro1/2.fa -dbtype prot -parse_seqids -out pro1/2 -logfile pro1/2.log **
blastn:
- 各自比对各自,展现物种内共线性;
**blastn -db pro1/2 -query $fIn1/2 -out pro11.blast -outfmt 6 -num_threads 8 -evalue 1e-10 -num_alignments 5 &**
- 两两互相比对,展现物种间共线性;
**blastn -db pro2/1 -query $fIn1/2 -out pro11.blast -outfmt 6 -num_threads 8 -evalue 1e-10 -num_alignments 5 &**
- 各自比对各自,展现物种内共线性;
Make gff -2
- 准备体现fa在genome上位置的文件,生成各自gff文件:
ch1\tpro_ID\tpos1\tpos2\n
chrID以两个字母开头+数字(+字母等) cat pro1.gff pro2.gff >pro.gff
make collinearity
`alias MCScanX='~dna/Environment/biotools/MCScanX/MCScanX/MCScanX'
MCScanX ./pro`
#pro.gff 和pro.blast 名字前缀一样;生成.tandem .collinearity .html/ 若没有tandem生成,可能是因为blast文件有错,比如缺少二者的比对。
- collinearity: 成对的共线性区域
- tandem: 串联基因
- html: 共线性可视化的html文件,里面有很多小文件,文件名称是根据参考基因组染色体编号来的。第一列是每个基因位点的复制深度,第二列是基因参考染色体,红色部分是串联基因,后面黄色部分的内容是比对上的共线性区域,只有哪些比对上的基因会被展现出来。html文件可以用网页浏览器打开。
make .ctl
circle.ctl
print Circle “1000\t//plot width and height (in pixels)\n”;
print Circle join(“,”,@chr1),”,”,join(“,”,@chr2),”\t//chromosomes in the circle\n”;
dot.ctl
print Dot “800\t//dimension (in pixels) of x axis\n”;
宽
print Dot “800\t//dimension (in pixels) of y axis\n”;高
print Dot join(“,”,@chr1),”\t//chromosomes in x axis\n”;
print Dot join(“,”,@chr2),”\t//chromosomes in y axis\n”;
make .png
cd /mnt/ilustre/users/dna/Environment/biotools/MCScanX/MCScanX/downstream_analyses \
&& java circle_plotter -g $dir/pro.gff -s $dir/pro.collinearity -c $dir/pro.circle.ctl -o $dir/pro.circle.png
java dot_plotter -g $dir/pro.gff -s $dir/pro.collinearity -c $dir/pro.dot.ctl -o $dir/pro.dot.png
报错
- could not find or load main class …… 检查是否软件make 编译正确
- 需要cd 安装目录,运行java 下游程序。
只能帮这么多了,因为我一开始一直运行不成功,就是没有cd目录 &&。。。。
参考:
http://jch100.cool.blog.163.com/blog/static/53267486201621193640965/
blastp format6格式
queryID dbID indentity% length mismatch gap querypos1 querypos2 dbpos1 dbpos2 e-value bit-score
链接地址:
http://www.360doc.com/content/17/0705/20/19913717_669146452.shtml