linux 韦恩图两个,nVenn:绘制广义的准比例维恩图

今天介绍一种绘制韦恩图的新工具:

nVenn:绘制广义的准比例维恩图

优势

nVenn可以通过输入包含标题,集合的数量、名称以及描述维恩图中每个区域的元素数目的文件,生成易于解释的n维维恩图的所有区域,同时保持每个区域的面积与包含的元素数量大致成比例。

nVenn提供了三种界面方式来绘制韦恩图:

1. 输入命令行

2. OpenGL图形输出

3. Web界面

(http://degradome.uniovi.es/cgi-bin/nVenn/nvenn.cgi)

软件获得方式

nVenn工具获取:https://github.com/vqf/nVenn

20409e648b7c3fb09d7b32ac1b65a2d6.png

获得软件解压缩后可以找到nVenn适用于linux和Windows系统的相应软件

19993bb6b6dfff48e84e4bea66f1dde7.png

原理

基于对称链分解生成所需数量的集合(n)的广义Venn图

生成n组的布尔格阵列

(该格阵表示每个区域为布尔向量,其中每个元素表示一个集合。如果该位置填充1,则该区域属于该集合,而如果该区域填充0,则该属性不属于该集合。)

通过模拟缩小每个区域得到韦恩图

大体过程如图:

0921ad56abc0b7af74446bceb33c165c.png软件三种界面介绍

当前版本的nVenn可以使用三种不同的界面

命令行,OpenGL图形输出和Web界面

虽然核心方法是一样的,每种风味都有不同的要求和使用方式。

(一) 命令行

点击nVenn.exe运行软件(适用于linux和Windows系统)

b46cc08911546d6ce616fbba21be8543.png

读取在软件所在文件夹的文件名

例如:venn_4set.txt

运行界面

3ca72e6506c12158f51819578f8791d7.png

文件格式:

虚线前:文本内容

虚线后:文本解释内容

文本包含了标题、集合个数、集合名字以及各区域元素个数

四位二进制数代表对应集合,0代表未在集合中,1代表在集合内

比如1000代表在集合1中,1100代表在集合1和2中

1ea3fd127d3a99d618e5c3eb5c738b64.png

得到结果文件统一命名为result.svg,同时还保留了过程中产生的文件result.svg.data

e5b848b776919cc0fb51a275be6dde84.png

结果说明:

每个圆中数字代表区域内元素的个数,数字下方括号内数字代表属于哪个集合或哪些集合的交集

通过重复执行,原则上可以处理无限数量的集合。

但是,必须注意的是,模拟完成所需的时间随着组数的增加而快速增长。

(二) OpenGL图形输出(仅适用于windows)

输入文件格式与命令行文件相同,但文件名必须为venn.txt

输出文件名为result.ps

运行过程:

46f216a41170632125abb0855173c677.png

d2f7de8e78effa7e639a18389d0b1288.png

97e59f95686d640a3e32ac966bef4730.png运行中用户可以决定实时何时从一个阶段跳到下一个阶段。

最终得到图形的输出文件:

655b3d6e31938a7d808bcc629c54789a.png

(三) web界面(最多绘制六个集合的韦恩图)

网址:http://degradome.uniovi.es/cgi-bin/nVenn/nvenn.cgi

(网址目前打不开,你懂得)

输入:在文本框中输入每个集合的成员。

web界面计算图的每个区域中的元素数量,运行nVenn并呈现输出。

bddbd9c2f8c30bddbd50e3c107e90ede.png

以GO:0045087(先天免疫系统)为例,

生成具有不同GO证据代码的六个子集:IBA(从祖先的生物学方面推断),IC(由策展人推断),IDA(从直接测定推断),IEA(从电子注释推断),ISS(从序列或结构推断)相似性)和NAS(不可追溯作者声明)。

输出结果:

2043b93130054592c1b1f05c632b99e1.png

结果解释:

所得到的韦恩图简要概述了每个子集的不同大小,以及它们之间的显着相关性。

IEA和ISS的交集非常大,使ISS几乎成为IEA的一个子集。

Web界面为分析图表提供了额外的工具,用户可以快速找出哪些元素对应于每个区域。例如同时勾选IEA和ISS就可以得到交集中所有元素的个数和元素名。

web界面面还允许定制最终图片。用户可以添加或删除标签来描述每个区域并显示其中包含的元素数量。每套的颜色和不透明度以及边框的宽度也可以调整。输出图可以以矢量格式(可缩放矢量图形,SVG)和位图格式(便携式网络图形,PNG)保存。

软件不足讨论部分

nVenn的目标是生成易于解释的图,韦恩图传达无限数量的信息。

尽管存在这种能力,但实际上很难将维恩图解释为六组以上。

通常情况下生成的韦恩图不一定是凸面或严格良好的形状,为了美观,在nVenn的开发中,最终图的一些审美品质优先于严格的比例。

当最终数字中的一些地区太小时,会出现进一步的比例偏差。

为避免不可见区域,最小圆半径设置为图的宽度或高度的1%。

设置的线与内圈的距离不同。

该功能可最大限度地减少线条之间的重叠,从而可以轻松追踪每条线条。

因此nVenn得到的是广义的近似成比例维恩图。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值