什么是UpSet图?
可以说是Venn图的变体,对于集合数据的可视化,适用于少量组别的数据集,一般用于转录组数据基因交集分析,而我最近在分析不同组别的代谢组数据的时候发现同理,下面以我自己数据为例,效果图如下:

UpSet图在线分析网站
-
我这里直接用的是联川生物云平台,云工具-搜索-UpSet图
-
下载官方示例文件准备数据
-
列名是基因名称(那我的示例中就是代谢物名称),行名是样品分组名称,该样品检测到了列名,对应位置就标记为“1”,否则为“0”,具体整理见下方数据准备

数据准备
- 网站有具体的视频教程,但简而言之就是所有组别鉴定到的物质名称并集作为一列,各组别包含这个物质就记为1,没有就记为0,下面进行示例:我要制作Rumen、Serum和Milk当中鉴定到的差异代谢物的Upset图
- A列是Rumen、Serum和Milk当中鉴定到的差异代谢物的并集,F/G/H是Rumen、Serum和Milk分别鉴定到的差异代谢物,现在目标是若F列和An列有重合的数据,在Bn列就标记“1”,比如查找A2的(+/-)12(13)-DiHOME这个,物质是否在Rumen中存在,使用公式
=IF(COUNTIF(F:F,A2)=0,"1","0")
,同列下拉即可(更多求两列之间重复数据的公式可以参考 Excel表格中两列数据对比,找出异同的数据)
- 都查找得到数据后,复制B/C/D后重新粘贴,选择
仅粘贴数值
,删除F/G/H列,即可保存上传网站进行分析
生成结果图与调整
不过多赘述,左侧参数调整
区域可以设置字号、图形大小、坐标轴等,右侧支持导出PNG/PDF/SVG/TIFF等多种格式,可调整图片大小,并可以下载交集数据,效果在题头已经给出,更多可以自行摸索