从零开始学Circos绘制圈图(一)

本文介绍如何使用Circos软件绘制基因组的酷炫图,包括基因密度分布、转座子密度分布及染色体间的共线性关系等。通过一系列教程,从环境配置到快速开始,逐步教授Circos的使用方法。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一般基因组文章都会有下面这种酷炫图,用来描述基因组的基因密度分布,转座子的密度分布,和其他物种或者多倍体的多套染色体间的共线性关系,以及其他各种你只要测序就能加上的信息,比如说你要是测了ATAC-seq,加上全基因组开放状态,要是测了多个组织,多个时期的RNA-seq,那就加上热图展现这种变化关系。

2013053-c3e913fd1cd44754.png
circos绘制基因组

当然除了基因组文章,其他类型的文章也可以考虑这种图。接下来我将会写一些列教程(可能有视频),通过教别人学Circos的方式来自学Circos。

环境配置

建议在Linux环境下配置Circos,之后只要用conda就能配置好分析环境

# 安装
## circos
conda create -c bioconda -n circos circos

测试软件安装结果

# 测试circos
conda activate circos
# 确认安装
circos -V
# 显示如下
# circos | v 0.69-8 | 15 Jun 2019 | Perl 5.026002

可以从http://circos.ca/software/download/下载官方的教程文件,分别是

处理过程

Circos依赖于一些列的配置文件,用来定义复杂图形的各个部分,最终加工成图形。

因此,用Circos画图是一个不断增添内容的过程,你要不断根据输出结果来调整输入参数。

并且整个分析中,你还要拥有过关的数据预处理的能力,这是因为Circos不是数据处理工具,它只是展示你已有的数据。

2013053-11fc8924662bf456.png
处理过程

快速开始

不管怎么样,先快速绘制出一个Circos图再说。

果子老师说过,我们不是先成为了老司机才开车,而是开车多了才成为了老司机。

第一步,先新建一个文件夹,用于存放本次分析的所有数据和配置文件

mkdir -p my_first_circos && cd my_first_circos

然后用vim karyotype.tair10.txt编辑文本,新增如下内容

chr - chr1 chr1 0 30427617 black
chr - chr2 chr2 0 19698289 black
chr - chr3 chr3 0 23459830 black
chr - chr4 chr4 0 18585056 black
chr - chr5 chr5 0 26975502 black

之后创建一个circos.conf文件,用于增加各类配置参数

touch circos.conf

vim circos.conf,增加我们的第一条记录,染色体信息

karyotype = karyotype.tair10.txt

然而要想真正的出图,还需要增加至少以下配置语句才行

<ideogram>
<spacing>
default = 0.005r
</spacing>
radius           = 0.90r
thickness        = 20p
fill             = yes
stroke_color     = dgrey
stroke_thickness = 2p
</ideogram>

<image>
<<include etc/image.conf>>
</image>

<<include etc/colors_fonts_patterns.conf>>
<<include etc/housekeeping.conf>>

在当前路径下运行circos -conf circos.conf, 最终效果图如下

2013053-c93a78b7d365b172.png
第一张图

虽然图比较丑,但是至少我们成功运行了人生第一次的circos, 这就相当于买了一套毛坯房,后面要做的事情就是不断装修。

比如说,我们至少可以让不同染色体拥有不同的颜色,修改之前的karyotype.tair10.txt中的最后一列

chr - chr1 chr1 0 30427617 chr1
chr - chr2 chr2 0 19698289 chr2
chr - chr3 chr3 0 23459830 chr3
chr - chr4 chr4 0 18585056 chr4
chr - chr5 chr5 0 26975502 chr5

在当前路径下运行circos -conf circos.conf, 最终效果图如下

2013053-126cafbda851096c.png
1564117790558

这就引出了第一个知识点,配色

为了实现配色,需要circos.conf文件了有一个和配色有关的语句

<<include etc/colors_fonts_patterns.conf>>

这里<<>>表示通过相对路径的方式加载另外一个配置文件,它的实际路径是和circos所在目录同级的etc,可用下面语句看到colors_fonts_patterns.conf的内容

circos_path=$(dirname `which circos`)
less ${circos_path%bin}/etc/colors_fonts_patterns.conf

你会发现,这个文件里还嵌套其他的配置文件。最终通过层层排查,你才知道etc/colors.ucsc.conf才是实际定义我们填写的颜色名的文件,而颜色的定义如下:

chr1  = 153,102,0
chr2  = 102,102,0
chr3  = 153,153,30
chr4  = 204,0,0
chr5  = 255,0,0

还有一个问题,为什么这里用的是两个尖括号<<,而不是一个尖括号<呢?这是因为<已经被用于分隔不同的语句块,如下语句就表示etc/image.conf里的配置信息是用来调整和image有关的配置,而不是去调整ideogram的配置。

<image>
<<include etc/image.conf>>
</image>

以上是快速开始部分,后续将会在此基础上,做出发表级别的图。

CIRCOS 是用于可视化循环的软件工具。如果你想从零开始CIRCOS,以下是些步骤和资源可以帮助你入门: 1. 了解 CIRCOS:首先,你需要了解 CIRCOS 的基本概念和用途。CIRCOS 主要用于可视化循环数据,如基因组比对、染色体相互作用等。你可以阅读官方网站(http://circos.ca/)上的文档,了解其功能和使用方式。 2. 安装 CIRCOS:在CIRCOS 之前,你需要在你的计算机上安装 CIRCOS。官方网站上有详细的安装指南,根据你的操作系统选择适合的安装方法。 3. 习语法和配置文件:CIRCOS 使用自己的配置文件来定义表的外观和数据的呈现方式。你需要CIRCOS 的语法和配置文件结构。官方网站提供了详细的文档和示例,你可以按照文档逐步习和实践。 4. 练习使用示例:CIRCOS 官方网站上提供了许多示例配置文件和数据,你可以下载并尝试运行这些示例。通过实际操作,你可以更好地理解和掌握 CIRCOS 的使用方法。 5. 探索其他资源:除了官方网站,你还可以寻找其他习资源,如教程、博客文章和视频教程。这些资源可以帮助你更深入地了解 CIRCOS 的高级功能和应用场景。 总的来说,CIRCOS 需要定的时间和实践经验。通过阅读文档、尝试示例和不断练习,你可以逐步掌握 CIRCOS 的使用技巧,并能够创建出令人满意的循环可视化效果。祝你习顺利!
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值