宏基因组实战10. 绘制圈图-Circos安装与使用

前情提要

如果您在学习本教程中存在困难,可能因为缺少背景知识,建议先阅读本系列前期文章

Circos安装与使用

Circos是不款功能强大的可视化软件,可以使用环状图形展示基因数据比较。可以添加多种图展信息,如热图、散点图等。

本教程目标:

  • 在Ubuntu上安装circos
  • 可视化宏基因组数据

注: 除了本文的简短教程,circos官网有非常详细的教程

安装Circos

sudo apt-get -y install libgd-perl

wd=~/test/metagenome17
cd $wd
mkdir circos
cd circos
curl -O http://dib-training.ucdavis.edu.s3.amazonaws.com/metagenomics-scripps-2016-10-12/circos-0.69-3.tar.gz
tar -xvzf circos-0.69-3.tar.gz

# 安装模块
circos -modules > modules
grep missing modules |cut -f13 -d " " > missing_modules
for mod in $(cat missing_modules);
do
sudo cpan install $mod;
done

# 检查模块是否安装好,全部出现OK则全部安装成功
circos -modules

# 运行演示数据
cd $wd/circos/circos-0.69-3/example
bash run

Use of uninitialized value in join or string at /mnt/bai/yongxin/test/metagenome17/circos/circos-0.69-3/bin/../lib/Circos/Heatmap.pm line 75.
上面报错信息,但并没有影响结果生成
将会产生`circos.png

image

可视化基因覆盖度和方向

mkdir ${wd}/circos/plotting
cd ${wd}/circos/plotting

# 链接prokka注释文件,salmon定量文件
ln -fs ${wd}/annotation/prokka_annotation/metagG.gff .
ln -fs ${wd}/annotation/final.contigs.fa .
ln -fs ${wd}/quant/*.counts .

# 下载脚本辅助绘图
curl -L -O https://github.com/ngs-docs/2016-metagenomics-sio/raw/master/circos-build.tar.gz
tar -xvzf circos-build.tar.gz
curl -L -O https://s3-us-west-1.amazonaws.com/dib-training.ucdavis.edu/metagenomics-scripps-2016-10-12/subset_assembly.fa.gz
gunzip subset_assembly.fa.gz
# 上步无法下载可翻墙或从上节位置复制 cp $wd/anvio-work/subset_assembly.fa .
mv subset_assembly.fa final.contigs.fa

使用khmer包提取长contigs可视化(太多人类不可读)

# 进入python3虚拟环境
. ~/py3/bin/activate
extract-long-sequences.py  final.contigs.fa -l 24000 -o final.contigs.long.fa

# 生成circos需要的文件
python parse_data_for_circos.py

python2.7.12报错File "/usr/local/lib/python2.7/dist-packages/pandas/core/indexing.py", line 1390, in error
(key, self.obj._get_axis_name(axis)))
KeyError: 'the label [count] is not in the [index]'

python3.5.2报错信息 KeyError: 'the label [count] is not in the [index]'

脚本应该是好脚本,只是不知道那里出了错。

# 手动运行脚本
mkdir -p org_gff
grep '>' final.contigs.long.fa |cut -f1 -d ' '|cut -f2 -d '>' > org_list
"for org in `cat org_list`; do grep -w $org metagG.gff > $org.subset.gff; done
mv *subset.gff org_gff
# 后面只有不多的python代码,只是我看不懂了,大神来帮忙看看问题吧parse_data_for_circos.py

Circos主要操作三类文件:
1. 配置文件,包括样式和输出的图
2. 核型文件,定义染色体大小布局
3. 图中的具体配置属性

上面的脚本产生核形文件和另外四个文件,它们都是什么,从那来的吗?

我们进入circos-build并打`circos:

cd circos-build
circos

此命令会产生circos.svg and circos.png看结果吧。

image

我们仔细看一下circos.config,可以按帮助尝试修改,如颜色、半径
大小,看看有那些变化?

参考文献

猜你喜欢

写在后面

为鼓励读者交流、快速解决科研困难,我们建立了“宏基因组”专业讨论群,目前己有国内外七十多位PI,七百多名一线科研人员加入。参与讨论,获得专业指导、问题解答,欢迎分享此文至朋友圈,并扫码加主编好友带你入群,务必备注“姓名-单位-研究方向-职务”。技术问题寻求帮助,首先阅读《如何优雅的提问》学习解决问题思路,仍末解决群内讨论,问题不私聊,帮助同行。
image

学习16S扩增子、宏基因组科研思路和分析实战,关注“宏基因组”
image

点击阅读原文,跳转最新文章目录阅读
https://mp.weixin.qq.com/s/5jQspEvH5_4Xmart22gjMA

绘制基因组变异圆圈图通常使用的工具是Circos。Circos是一个用于可视化科学数据的软件,特别适用于绘制基因组相关的图形。 以下是使用Circos绘制基因组变异圆圈图的一般步骤: 1. 准备数据:将基因组变异数据整理为适合Circos使用的格式,通常为文本文件或者表格。确保数据包含变异的位置、类型和其他相关信息。 2. 安装Circos:首先需要下载和安装Circos软件。你可以从Circos官方网站(http://circos.ca/software/download)下载并按照指南进行安装。 3. 配置Circos:在安装完成后,你需要配置Circos的参数文件。这个文件定义了绘图的样式、数据文件的路径和其他设置。你可以根据自己的需求进行配置。 4. 数据解析:在配置完成后,你需要编写一个脚本或程序来解析基因组变异数据文件,并将其转换为Circos所需的格式。这个格式通常为一个特定的文本格式,描述了每个变异的位置、类型和其他相关信息。 5. 绘制图形:使用解析后的数据,运行Circos程序来生成基因组变异圆圈图。Circos会根据你的配置文件和数据文件生成相应的图形。 6. 自定义样式:如果需要,你可以根据自己的需求对图形进行自定义。Circos提供了丰富的配置选项和样式设置,你可以根据自己的需求进行调整。 请注意,绘制基因组变异圆圈图是一个复杂的过程,需要一定的编程和数据处理能力。如果你不熟悉Circos或者编程,建议寻求相关领域专家的帮助或者使用一些基因组可视化工具来简化这个过程。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值