1 简介
RCircos软件包提供了一组图形功能,实现了基本Circos 2D轨迹图,用于可视化基因组结构的异同和基因组间隔之间的位置关系。该软件包是用R库安装附带的R图形包实现的,目的是降低使用的复杂性,并增加集成到基因组数据处理的其他R管道中的灵活性。
目前提供以下图形功能:
- 人、鼠和大鼠的染色体表意文字图数据图包括:
- 热图
- 柱状图
- 线
- 散点图
- 平铺图
- 用于进一步装饰的图项目包括:
- 连接器
- 链接(线和条带)
- 文本(基因)标签
成功安装RCircos后,需要加载库才能开始使用它:
library(RCircos)
2 输入数据格式
RCircos以数据框的形式获取输入数据,该数据框可以是从read.table()返回的对象,也可以是与当前R会话中的其他管道一起生成的对象。除链接图的输入外,数据帧的前三列必须是按染色体名称、染色体开始和染色体结束位置的顺序排列的基因组位置信息。
data(RCircos.Histogram.Data)head(RCircos.Histogram.Data)
对于基因标签和热图,必须在第四栏提供基因/探针名称。对于其他绘图,此列可能是可选的。
data(RCircos.Heatmap.Data)head(RCircos.Heatmap.Data)
与其他绘图数据不同,链接线绘图的输入数据仅具有按染色体名称A、chromStart A、chromEnd A、染色体名称B、chromStart B和chromEnd B的顺序的每行的成对基因组位置信息。
data(RCircos.Link.Data)head(RCircos.Link.Data)
备注:RCircos会将输入数据转换为RCircos绘图数据,但不提供常规数据处理功能。如果数据框没有基因组位置信息,则必须在将其传递给RCircos函数之前将该信息添加到数据帧中。出于演示目的,包中包含了示例数据集,并且可以使用data()方法轻松地浏览它们。
从版本1.1.2开始,用户可以向输入数据追加一列标题为“PlotColor”的绘图颜色名称,以控制除热图绘图以外的每个数据点的颜色。
3 绘图轨道布局
RCircos遵循与Circos绘图相同的算法,并在轨道中排列数据绘图。轨道可以放置在染色体表意文字的内部或