开源大数据架构 指标_了解开源项目背后的指标

开源大数据架构 指标

开源项目背后的数字告诉我们什么去向? 这是Jesus M. Gonzalez-Barahona在本月晚些时候 OSCON 2014 演讲的主题,他研究了四个开源云计算项目( OpenStack ,CloudStack,Eucalyptus和OpenNebula),并将这些数字转化为有意义的分析。

Gonzalez-Barahona知道分析。 作为Bitergia的共同创始人,他是开源软件项目定量方面的专家。 Bitergia的目标是分析软件开发指标,并通过管理和改进其流程来帮助项目和社区使用这些数字。

在这次采访中,冈萨雷斯-巴拉奥纳(Gonzalez-Barahona)与我分享了他在OSCON 2014上的演讲,该演讲利用了指标,趋势,可视化等内容。


在不花太多钱的情况下,您将在OSCON演讲中讨论什么?

我将针对四个云基础设施项目(OpenStack,CloudStack,Eucalyptus和OpenNebula)对开发社区进行分析。 我将尝试说明,即使在许多方面都千差万别,它们(或至少其中一些)也显示出类似的趋势。

告诉我们一些关于Bitergia的信息。 完全专注于开源项目有什么令人兴奋的事情?

我们认为,要做出涉及自由和开源软件的合理决策,您需要考虑社区和开发社区。 为此,您需要表征它们的数字和数据。 我们旨在提供这些数据并帮助您理解它们。 开源软件项目是整个软件开发领域中最激动人心的领域。 帮助他们理解它们,并为人们提供工具以增进他们对项目和社区的了解,这使我们真正感到高兴,并且是一种持续不断的乐趣。

您认为对于开源项目最重要的指标是什么? 它们因项目而异吗?


查看完整的OSCON演讲者访谈集

它们可能因项目而异,但是某些指标很有用。 例如,通过同类(或世代)确定开发人员年龄的人员,几乎可以立即显示出项目随着时间的推移对开发人员的吸引和保留。 只需快速浏览,您就可以确定经验丰富的人是否还在附近,是否有新血统或精疲力竭。 从多元化的角度来看,公司的参与也很有趣。 当然,还有一些与中立性相关的指标:公司和独立开发人员如何进行交互,如果其中一些在交互时会受到青睐。 活动指标已经使用了很多年,而且显然也很有趣。 现在,我们在性能指标上进行了大量工作:错误修复的工作状况如何,或者在代码审查过程中碰巧遇到了哪些瓶颈。

项目如何利用指标来指导决策? 您能想到的最好的例子是,展示一个项目如何从他们所学的知识中得到改善?

仅举两个例子:

在了解了其老化指标之后,某家公司决定投资一项全新的政策,以使开发人员继续参与其宠物项目,因为他们意识到对于某些同类群体而言,他们失去了太多此类开发人员,而且他们确实冒着没有一个经验丰富的开发人员的风险一两年

通过一些开源基金会,我们一直在非常精确地确定与某些公司有关联的开发人员的参与和努力,因为这对于这些公司之间在决定如何协调以支持项目方面的谈判至关重要。

这些年来,您一直在研究各种开源项目的指标,那么让您感到惊讶的是什么? 是否有任何趋势正在出现?

您一次又一次看到的事情是,在一些大型项目中,公司支持的重要性如何。 当然,个人开发人员很重要,但是大中型公司可以通过仅向项目分配经验丰富的人员来决定将开发人员数量增加一倍,从而促进该项目并产生大量动力。 但是过程并不容易:您必须仔细了解动态,以免对志愿开发人员或其他未按相同进度投资该项目的公司的其他人造成倦怠感。 有些人可能认为“帮助加速”项目只是在项目(或开发人员)上投入资金的问题。 相反,我们看到这几乎是一门艺术:您必须仔细跟踪正在发生的事情,并对问题做出快速React,甚至可能放慢速度以免完全浪费精力。 但是,我们也已经看到,如何运作,在短短几年内,几乎有可能使零开发人员变成零甚至数百甚至数千个开发人员,并且仍然拥有一个可持续发展和健康的社区。

可视化如何以有意义的方式帮助快速向项目社区提供数据快照?

周围有太多数据,因此您需要正确的可视化来找到有趣的信息。 适当的图表,或者在某些情况下只是适当的数字,可以为您提供比大量数据更多的洞察力。 我想这在大数据问题中很常见。 考虑到分析大型开放源代码软件项目是分析数百万条记录(提交,工单更改,帖子等)的问题。 您要么拥有正确的可视化效果,要么迷路了。

为什么拥有开源软件工具来分析开源项目很重要?

如果环顾四周,就会出现一些用于分析和可视化开源软件开发的系统。 但不幸的是,其中大多数是专有的。 我很遗憾地说,因为对于整个开源软件社区而言,这是一个遗憾。 这不仅是因为您没有足够的资源来使用这些系统,还是因为您无法控制它们而无法按需使用它们。 即使他们是免费的,并且您基本上拥有了您所需要的东西,他们仍然可能无法充分受益。 您无法按照自己的意愿进行创新。 随着需求的发展,您无法适应该系统。 您不能随意插入其他数据或其他系统。

简而言之:您无法控制。 这不是什么新鲜事物,这只是我们所有人都偏爱开源软件并发现它更方便和更具竞争力的原因清单。 但是对我来说,特别令人关注的是,在我们需要更好地了解我们的项目如何运作的领域中,我们将拥有使用专有系统或服务的唯一选择。 由于所有软件都是开源的,因此所有公开和可用的数据(包括中间数据)对于未来几年开源软件的分布式控制和改进至关重要。

查看完整的OSCON演讲者访谈集。

翻译自: https://opensource.com/business/14/7/interview-jesus-gonzalez-barahona-bitergia

开源大数据架构 指标

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值