大家从GitHub相关指标以及趋势数据可以清楚的看到,DataEase自2021年6月开源发布后,在短短1年半的时间里超越了很多其他开源项目,获取了相当高的认可。介绍怎么选开源数据可视化工具之前,我们先来给大家推荐一个网站OpenLeaderboard,
https://open-leaderboard.x-lab.info/open-leaderboard.x-lab.info/
该网站是由X-lab开放实验室负责的,X-lab 开放实验室定位为一个开源研究与创新的开放群体,是一群由来自国内外著名高校、创业公司、部分互联网与IT企业的专家学者与工程师所构成,聚焦于开源软件产业开放式创新的共同体。专业背景包括计算机科学、软件工程、数据科学、工商管理学、社会学、经济学等跨学科领域,长期思考并实践开源战略、开源测量学、开源数字生态系统等主题。目前已在包括开源治理标准制定、开源社区行为度量与分析、开源社区流程自动化、开源全域数据治理与洞察等方面做出了较有影响力的工作。
进入OpenLeaderboard网站后,我们选择项目页签,同时选择自己想查看的开源项目的指数,同时选择时间范围一年,如下图所示:
活跃度
活跃度是基于历史行为日志数据的分析方法,在全域范围内统计 GitHub 所有仓库和开发者的行为,并对 GitHub 行为数据的加权的算法,具体的计算方式为:Ad=∑wiciAd=∑wici 其中的 AdAd 为开发者活跃度,而 cici 为上述五种行为事件由该开发者触发的发生次数,wiwi 为该行为事件的加权比例。按照一个简单的价值评判,我们可以将这个值设置为 1 - 5,即 Issue 评论每个计 1 分、发起 Issue 每个计 2 分、发起 PR 每个计 3 分、PR 上的代码 review 评论每个计 4 分、PR 合入一个计 5 分。在计算出每个开发者的活跃度后,可以通过一种加权和的方式来计算项目的活跃度,之前给出的方式是:Ar=∑Ad−−−√Ar=∑Ad 即项目的活跃度为所有开发者活跃度的开方和,这里开方是为了降低核心开发者过高的活跃度带来的影响。
OpenRank
在活跃度的基础上设计了一种新的上层算法,一种基于全域开发者协作网络的项目影响力评估方法,在一次性评估出所有项目的协作影响力的同时,也可以对项目的协作关联度进行深入探索,并对项目的所属类别进行自动判断,从而得出项目和个人的网络协作影响力。
上面推荐完成后,想必大家就知道我们该怎么选了,我们逐一看看:
从活跃度角度,DataEase排名69,
我们再搜索一波OpenRank指标,DataEase排名42,
另外,我搜索了一波SuperSet、Datawrapper、Preset,在前300名中均为找到。
这个还是蛮显而易见的,那我们再进去看下DataEase开源数据可视化BI工具的详细的开源指标展示,如下图所示:
大家从GitHub相关指标以及趋势数据可以清楚的看到,DataEase自2021年6月开源发布后,在短短1年半的时间里超越了很多其他开源项目,获取了相当高的认可。