寒武纪ai芯片创始人_Deeplearning4j创始人致力于发展AI社区

寒武纪ai芯片创始人

Deeplearning4j是为Java和Scala编写的开源分布式神经网络库。 它也是我创建的聊天服务Gitter上最活跃的社区之一。 我对他们如何建立一个繁荣的开源社区很感兴趣,我伸出手让他们对他们所学到的教训有所了解。 在对两位创始人Adam GibsonChris Nicholson的采访中,也许您会找到一些项目建议。 ( Josh Patterson还是创始人 。)

告诉我们一些有关您自己和Deeplearning4j社区的信息。 这一切是如何开始的?

我们于2013年底开始构建Deeplearning4j。亚当当时从事机器学习大约有四年,而深度人工神经网络的前景越来越看好。 Deeplearning4j中的第一个网络是受限的Boltzmann机器 ,因为这是Geoff Hinton在2006年提出的网络,这是该领域的转折点。 我曾在另一家从事公关和招聘的初创公司工作,以前曾担任过记者,所以我照顾了文档(现在仍然这样做)。

我们相信适当的沟通对于使开源代码有价值至关重要。

您使用什么数字工具来帮助管理和发展社区?

该代码位于GitHub上 ,而对话位于Gitter上 。 Gitter频道上目前大约有1,360个开发人员,因此它可能是地球上最活跃的神经网络对话之一。 我们的网站托管在GitHub上,因此内容也在那里。

我们使用Javadoc (总是WIP)生成了大量自动文档。 我们要求人们使用Maven作为其自动构建工具。 任何软件的最大问题之一就是安装,而Maven则使安装变得更加容易。 您需要不断尝试清除障碍,以便人们可以只使用您的代码,而不必担心其他问题。

在Gitter的Deeplearning4j频道中,大多数讨论是关于什么的?

讨论的主要问题曾经与安装有关。 社区的工程师教给我们很多有关如何编写更清晰的说明以及如何使代码和体验更好的知识。 如果没有反馈循环,那么Deeplearning4j就不会是今天。 开源社区对于质量控制而言是惊人的。 您越早解决问题,社区对于该问题的要求就越少。 快速行动是一个很大的动力。

现在的主要问题是加载数据和神经网络调整。 我们正在努力就此进行更好的沟通,并使框架更好,以使ETL和调整变得更加容易。 关于机器和深度学习,还有很多基本问题。 许多软件工程师已经发现深度学习和机器学习确实是功能强大的工具,因此他们正在尝试掌握新的想法。 我们已经写了很多介绍性材料,并将它们指向解释了这些想法的各种网页。

您和您的社区有哪些共同目标?

该社区以Deeplearning4j和我们的科学计算库ND4J (以神经网络为动力)为中心。 因此,我们回答了有关如何使用库的问题,并且在此过程中,我们帮助人们进一步了解了深度学习的总体知识。 不幸的是,这不是一个深度学习热线,因此有些问题我们不会回答。 但是,我们确实可以帮助DL4J社区中的工程师构建应用程序,并了解神经网络的工作原理。

共同的目标是学习深度学习,并构建有趣的东西。 就深度学习的作用而言,我们只看到了冰山一角。 到目前为止,我们已经看到了图像识别,机器翻译,机器转录和时间序列预测方面的巨大进步。 在许多方面,机器感知现在等于或超过人类感知,这将以难以想象的方式改变社会。 这些更改尚未实施。 因此,社区的次要目标是将这种狭义的AI形式带入世界,从而有所作为。

哪些因素有助于您社区的成功?

创建和维护社区是时间和精力的巨大承诺。 您必须有空,并且必须尝试了解其他人的来源。 他们对术语的了解并不总是足够准确,无法提出确切的问题,因此您必须耐心与他们一起弄清楚他们要问的问题或卡在哪里。 我们并不总是像我们应该的那样耐心。 可用,做出努力并为诸如此类的强大工具提供支持是建立社区的好方法。

当一个大型项目的制造者可以回答有关其工作方式的深奥问题时,这会建立起很大的信任,因为人们知道您以权威说话,而且如果某件事确实被破坏,那么它将得到解决。 社区和项目创建者之间存在紧密的反馈循环。

您在管理社区时会遇到哪些挑战?

挑战之一是:我们关心什么问题,人们需要自己回答什么问题? 如果有人对Java,像IntelliJ这样的IDE或像Maven这样的构建工具有真正的基本问题,那么大多数时候他们需要自己弄清楚这些问题。 尽管在某些特殊情况下我们会提供帮助,但我们的Gitter通道并不是正确的解决方法,因为有时您需要扩展堆空间才能使神经网络正常工作。

您还必须在构建社区和构建产品之间找到平衡。 理想情况下,您将拥有一支由专职支持工程师组成的大型团队,其余团队都在代码库中工作。 但是大多数开源项目都有非常小的团队。 只有少数人能够提供支持,而他们也是应该修复错误和添加功能的人。

您如何鼓励对社区的承诺和贡献?

您在社区中创建了一个智能,友好的环境。 您提醒他们感谢您的贡献,并尽可能地向他们展示需要进行哪些工作。 我们创建了顶级文件来识别我们的贡献者, 向人们展示如何做出贡献 ,并制定社区规则。 我们还编写了一个devguide ,现在将所有问题标记为Bug,增强功能或文档,以便人们可以快速扫描队列并探索可以在其中添加内容的地方。

告诉我们一些有关建立和建立社区所需的时间投入。 持续需要多少社区维护?

Skymind是一个分布式团队,在澳大利亚,欧洲和美国拥有工程师,几乎在每个时区都有Deeplearning4j社区成员。 一名Skymind工程师正在监视Gitter队列,大概是每个工作日的12-16小时。 这是一个非常认真的承诺,因为我们中只有不到10个人。 这不是他们的全职工作,但也许他们将在停机时运行单元测试并回答有关Gitter的问题。

根据您的经验,您是否认为开源社区在过去几年中发生了变化和发展?

开源赢得了企业堆栈,因此它比以前重要得多。 世界上最大的组织都在运行开源软件。 Linux赢得了操作系统,Hadoop赢得了大数据存储,而开源则赢得了胜利,因为正确执行操作将获得更好的代码。 更多的眼球意味着更多的正常运行时间。 多年来,开源软件社区的规模以及软件工程师对开源项目的重视程度都在增加。

您对想从头开始建立在线开源社区的人有什么建议?

首先,构建一些整洁的东西。 您关心的事情。 专注于构建一件有效的事情。 然后,与人分享。 他们将帮助您改进它,并且可以帮助您考虑下一步要做什么。 不要做太大的前期开发。 尝试确定范围,以便可以在合理的时间内发货。 说几周。 开源是很有价值的,因为它是一次对话,而对话会引导您进入,以便您和项目以您无法预料的方式发展。 此外,通过及早开放资源,您会增加曝光率,因此有获得帮助的机会。 我们有很棒的开发人员加入社区和Skymind团队。

您能否分享社区成员的成功故事,这要归功于他们参与您的频道?

对于大多数故事,您只需要在那里。 但是总的来说,许多数据科学家和Java工程师来了,他们只是为自己的公司构建了一些可行的工具。 他们稍后会再说:“将DL4J纳入推荐系统后,广告覆盖率增加了200%。”

另一个人用DL4J构建了一个应用程序,然后一个投资者看到了它并筹集了资金。 所以这一切都很酷。 使用开放源代码时,您会把一块石头扔进大海,而您并不总是听到它撞到水里的声音。 您甚至看不到涟漪。 因此,当人们回来说“谢谢”并告诉我们它如何帮助他们时,这是令人鼓舞的。 这使其更有意义。

翻译自: https://opensource.com/life/16/3/interview-deeplearning4j-gitter

寒武纪ai芯片创始人

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值