原文链接:码云封面人物:朱小杰
本期嘉宾:
朱小杰 :硕士,毕业于北京航空航天大学计算机系。2013年加入中国科学院计算机网络信息中心,主要研究方向大数据处理,大数据流水线。 国家重点研发计划-云计算和大数据专项“面向智能制造的供应链流程管控软件平台”项目子课题负责人。PiFlow 项目技术负责人
PiFlow :混合型科学大数据流水线系统,包含丰富的处理器组件,是一个简单易用,功能强大的大数据流水线系统。2019 年 3 月入选 GVP—Gitee 最有价值开源项目。
正文
PiFlow 项目是怎样开始的?为什么在今年3月份的时候选择开源?
在大数据的时代背景下,大数据正在影响我们的社会、生产、生活方式。但在产业落地的过程中,存在专业技术门槛高、专业人员少、落地困难的问题。而中国科学院计算机网络信息中心在大数据方面有多年的技术积累,为了能让大数据技术更多地普惠产业,让技术走进生产生活,结合国家大数据的战略计划,PiFlow 项目应运而生了。
PiFlow 是一个大数据处理流水线系统,在项目最初阶段,我们并没有一个很好听的名字,而是本着解决大数据处理过程中的实际问题的初心,启动了这个科研项目。在项目初期,部门领导给予了充分支持和鼓励,我们曾一度有8人投入在这个项目中。而后,有越来越多的 PiFlow 可以解决的问题作为实际需求被提出,我们也发现业界对大数据流水线技术的追逐越来越热,而市面上并没有完全满足相关技术需求的产品,基于我们对专业性和其价值的判断,我们决定将其开源。
PiFlow 的团队规模和构成是怎样的?男女比例如何?
PiFlow 团队由产品经理、架构师、后端核心开发人员、前端核心开发人员组成。最多的时候有 1 个产品经理、1 个架构师、2 个前端,3 个后端人员在投入。其中博士 2 名,硕士 3 名,和本科生 3 名。人员男女比在3:1。
<