Table of Contents
1 神灯软件的使用总结(GenomePixelizer)
这是一款生物分析类型的软件。从开始到现在我使用到功能只有其中的一 个功能,也就是对染色体上的位置进行分类分析,这里最重要的是对输入格式 以及某些用到功能进行解释。
1.1 运行所需要的文件
我们要对一个物种进行分析,我们需要提供给神灯一个文件。我这里一Yeast 也就是酵母为例子。 在根目录下放入一个Yeast.txt的文件,当然名字你自己随意。 然后里面是我们得到什么样子图的关键。
1. name of file containing gene coordinates: ./sheep/Yeast/GC_all_3.txt 2. name of the distance matrix file: 3. number of chromosomes: 16 4. size of chromosomes: 20.3 80.1 31.4 152.3 56.8 26.7 106.8 52.5 43.1 72.7 65.8 105.9 91.7 77.2 106.4 94.2 5. identity upper level: 500 6. identity lower level: 600 7. window size (pixels) X: 10000 8. window size (pixels) Y: 10000 9. html prefix: http://mips.gsf.de/cgi-bin/proj/thal/search_gene?code= 10. Title: a 11. Laboratory: b ######################################################## ##### for experienced users below this line ######## 12. W/C correction: A 13. horizontal size of gene: 10 14. vertical size of gene: 10 15. W/C coefficient: 3 16. W/C correction value: 5 17. chromosome thickness: 4 18. gene feature mode (standard [std] or extended [ext]): std
我们从上面的文件可以非常明显的看到分为18条,每一点代表这不同的选择,修改后你会得到不同的图。 1.第一点是你画图需要的文件。./表示当前目录,也就是在软件的根目录下,你可以自己新建一个文件 夹,然后把文件放进去,只要修改上面文件的第一行就可以了
2.这个是用来显示两个gene间的相互作用的,也就是在染色体的图上将两个相互作用的gene用直线连接 起来
3.染色体的数目,酵母的是16条
4.每条染色体的大小,你这里可以按照染色体的实际长度,也可以把所有的染色体按照比例进行缩放。
5.这个和2是一体的,两个相互关联的gene之间有相似度的概念,和6相互作用确定上限和下限。
7.这个控制生成图片的大小。这里可以适当的设置的大些,分辨率相应的就会高些。
13.我们最后生成的图片,每一个位置用一个方块表示,horizontal size 控制的是小正方块的宽。
14.控制小正方形的高
15.加入我们在相同的位置,有几个点聚集在一起。那么这个参数控制的就是他们的距离,如果设置为1, 那么两个小方块之间就会靠的非常的紧密,大部分年区域重叠在一起。如果设置的大一些,上下两个小 方块就会有一定的间距。如果相同点的mark比较多最好设置的大一些。
16.这个和上面两个加起来才能控制的更好
17.染色体的粗细程度,这个看大家的喜好
1.2 输入文件的格式
1 1 8.075 W red Yeast 1 2 8.7519 C red Yeast 1 3 9.2614 W red Yeast 1 4 10.8919 C red Yeast 1 5 12.4218 W red Yeast 1 6 12.9009 C red Yeast 1 7 12.9009 W red Yeast 1 8 12.9009 C red Yeast
这里的第一列是染色体的编号,第二列是所有mark的编号,后面是在染色 体上的位置,当然要和染色体一样,进行同样程度的缩放。然后后面是位点 在染色体的上下的位置,W表示上,C表示下。 这里有一个特别要注意的点: 加入在染色体的同一个位置有8个点,我们必须要把他们放在一起。然后W和C 交替W,不能同时为C或者W,必须交替。假若你都用W想把所有的位点都放到 上面,那么你只能得到4个点。
输入的第二个文件,也就是用来gene之间的相互连接的,格式如下:
1: YBR160W YKL042W 0.67 2: YBR160W YDR130C 0.98
上面的文件第一列和第二列是两个相互作用的基因,第三列就是我们上面说的 Identity,只有Identity的数值在我们规定的范围内的才能够在图上显示。
然后附带一个得到上面格式的程序: 我们的输入文件内容如下:
1 1 13 131635 136160 133897.5 1 2 13 131635 136160 133897.5 1 3 18 123717 124719 124218 1 4 2 184396 184397 184396.5 1 5 2 198874 199811 199342.5
use strict; use warnings; my @information; my $cout; my $length; my (%hash,$key1,$key2,$key3); open(OUT,">GC_all_3.txt")||die("can not open"); open(IN,"GC_all_2.txt")||die("can not open"); while(<IN>) { chomp; @information=split/\s+/,$_; $hash{$information[0]}{$information[5]}{$information[1]}="A"; } foreach $key1 (sort {$a<=>$b} keys %hash) { foreach $key2 (sort {$a<=>$b} keys $hash{$key1}) { $length=$key2/10000; foreach $key3 (sort {$a<=>$b} keys $hash{$key1}{$key2}) { $cout++; if($cout%2==0) { print OUT "$key1\t$cout\t$length\tC\tred\tYeast\n"; } else { print OUT "$key1\t$cout\t$length\tW\tred\tYeast\n"; } } } }
1.3 图片的生成
最后的图片文件的生成: 图形界面下方,MakePostScript后点击可以生成图片,后面有框可以自定 义图片的名称,生成的是.ps的文件。可以用Photoshop可以进行图片的转换。
1.4 总结,现在暂时使用的是这些,以后有其他的用处再进行补充。
Date: 2013-05-31 14:29:24 CST
HTML generated by org-mode 6.33x in emacs 23
1. name of file containing gene coordinates: ./sheep/Yeast/GC_all_3.txt
2. name of the distance matrix file: ./sheep/Yeast/result_3.txt
3. number of chromosomes: 16
4. size of chromosomes: 20.3 80.1 31.4 152.3 56.8 26.7 106.8 52.5 43.1 72.7 65.8 105.9 91.7 77.2 106.4 94.2
5. identity upper level: 100
6. identity lower level: 50
7. window size (pixels) X: 3000
8. window size (pixels) Y: 3000
9. html prefix: http://mips.gsf.de/cgi-bin/proj/thal/search_gene?code=
10. Title: a
11. Laboratory: b
########################################################
##### for experienced users below this line ########
12. W/C correction: A
13. horizontal size of gene: 10
14. vertical size of gene: 10
15. W/C coefficient: 1
16. W/C correction value: 5
17. chromosome thickness: 4
18. gene feature mode (standard [std] or extended [ext]): std