Circos作图
写在前面
当矩形图无法满足要求的时候,我们就要掰弯它。
circos图是出现在各大期刊上的概率大大提高了,这不仅仅因为它好看,其次Circos还能同时展示出不能类型的数据。
一、Circos的安装
- 1、conda安装
通过conda search circos
,我们可以看到有很多个circos版本,因此我们无论安装哪个版本都是可以的。conda软件的安装在前面的文章中已经具体讲解。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-iGohKlon-1615365386044)(https://imgkr2.cn-bj.ufileos.com/13041b23-4872-46bb-b8f7-bc28e7dc4ae1.png?UCloudPublicKey=TOKEN_8d8b72be-579a-4e83-bfd0-5f6ce1546f13&Signature=b%252FXbhaBf2coOueKmrxMalh%252BvNJw%253D&Expires=1606802061)]
conda create -n circos
conda activate circos
conda install -y circos
- 2、源码安装
wget http://circos.ca/distribution/circos-0.69-8.tgz
tar -zxvf circos-0.69-8.tgz
安装完成后添加到环境变量中就可以了。
由于源码安装需要自己去安装Circos软件所需要的perl模块,因此在使用软件前需要检查所需的模块的是否安装成功。
circos -modules
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-uKxThtBS-1615365386046)(https://imgkr2.cn-bj.ufileos.com/6435dacf-4720-485d-b35e-2831cb0b1c9d.png?UCloudPublicKey=TOKEN_8d8b72be-579a-4e83-bfd0-5f6ce1546f13&Signature=UvMtGKbVim4xTsn7BjrEAtllCc4%253D&Expires=1606803824)]
二、Circos画图
- 1、准备配置文件
(1)最外圈染色体文件
#chr - 染色体名字 circos染色体名字 染色体开始位置 染色体终止位置 颜色
chr - Supercontig_1 1 0 9798892 chr1
chr - Supercontig_2 2 0 4478682 chr2
chr - Supercontig_3 3 0 5274801 chr3
chr - Supercontig_4 4 0 6000760 chr4
chr - Supercontig_5 5 0 6436245 chr5
(2)内圈配置文件
绘制直方图
<plot>
# 设定为直方图
type = histogram
# 用于画直方图的数据文件路径。该文件需要编写程序生成。
# 数据文件为4列:
# chromosome start end data
# Supercontig_1 0 9999 0.489
file = gc.histogram.txt
# 设置直方图的位置,r1 要比 r0 大。直方图的方向默认为向外。
r1 = 0.95r
r0 = 0.80r
# 直方图的填充颜色
#fill_color = vlgrey
color = red
# 默认下直方图轮廓厚度为 1px,若不需要轮廓,则设置其厚度为0,或在 etc/tracks/histogram.conf 中修改。
thickness = 6p
# 直方图是由 bins (条行框)所构成的。若 bins 在坐标上不相连,最好设置不要将其bins连接到一起。例如:
# hs1 10 20 0.5
# hs1 30 40 0.25
# 上述数据设置值为 yes 和 no 时,图形是不一样的。
extend_bin = no
# 设置坐标轴的最大值和最小值
max = 1
min = 0
# 设定直方图的背景颜色
<backgrounds>
show = data
<background>
color = vvlgrey
</background>
</backgrounds>
</plot>
绘制 热图
<plot>
# 绘制 heat map
type = heatmap
# 指定热图的数据文件路径。该文件需要编写程序生成。
# 数据文件为5列:
# chrID start end data class
# Supercontig_1 1151 2878 32.62 id=Nc000
# Supercontig_1 1151 2878 63.02 id=Nc015
# Supercontig_1 1151 2878 165.36 id=Nc060
# Supercontig_1 1151 2878 125.84 id=Nc120
# Supercontig_1 1151 2878 34.58 id=Nc240
file = gene_expression.heatmap.txt
# 设定图形所处位置
r1 = 0.75r
r0 = 0.69r
# 设定数据显示的规则。以下规则表示,FPKM值在 0, 10, 100等区间使用4种不同的颜色表示。
<rules>
# 以下可以设置多个 rules
<rule>
# 条件判断,每个 rule 都有一个condition参数;如果该condition为真,则不对数据进行展示。
condition = var(id) ne "Nc000"
show = no
# 若flow参数值为continue,则继续往下执行。
flow = continue
</rule>
<rule>
condition = var(value) <= 0
color