数据质量 开源框架_Netflix开源Polynote框架,可简化数据科学和机器学习工作流程...

caa3acbf5bc22c26627b8f23212c5f51.gif

编辑 | KING

发布 | ATYUN订阅号 

机器学习和数据科学开发并不是一件简单的事情,但是Netflix希望通过一个免费的新平台来简化繁琐的工作。这家科技巨头今天宣布已开源Polynote,这是一种多语言编程notebook环境,与Apache Spark集成,并为Scala、Python和SQL提供强大的支持。 Polynote旨在使数据科学家和AI研究人员将Netflix的机器学习框架与Python机器学习和可视化库相集成。现在,它可以从 Polynote.org 和 GitHub 免费获得。 5cd69a3483c6e638a4a8f2b65e143e4b.png Netflix在一篇博客文章中说:“在Netflix基础架构团队中,我们的工作是通过构建可消除的痛点和使研究人员专注于研究新的工具来加速机器学习创新。Polynote优化了现有notebook工具的缺点,特别是在对Scala的支持方面。在Netflix,我们一直对与开源社区共享充满信心,并相信Polynote除了在满足Netflix之外在其它方面具有巨大的潜力。” 对于初学者,notebook执行是在特定时间和特定环境中运行的特定代码的记录。它是一个有序的单元格集合,每个单元格可以保存代码或文本,并可以独立进行修改和执行。可以重新排列,插入和删除单元格,它们通常取决于notebook电脑中其他单元格的输出。 7d858ab197f5f062e4fb021624673626.png Polynote新颖的可重复性功能在执行之前考虑了单元格在notebook中的位置,有助于避免使notebook电脑难以重新运行的不良做法。此外,除了具有支持高质量LaTeX排版系统的富文本编辑器之外,它还具有类似于集成开发环境的功能,包括交互式自动完成和参数提示以及行内错误突出显示功能。 顾名思义,Polynote是一个多语言系统,这意味着notebook中的每个单元格都可以用不同的语言编写,并且它们之间可以共享变量。(内核或执行代码的计算引擎将可用的类型化输入值提供给单元格的语言解释器,语言解释器又将结果类型化的输出值提供回内核。)此外,Polynote还支持以保存在其中的配置和依赖项设置notebook本身,同时使用Matplotlib(Python 2D绘图库)和可视化语法Vega启用数据探索。 d5f1ee17ec0d6b1e3c55812d4911925b.gif Polynote中的符号表可让您深入了解notebook的内部状态,而单独的状态区域则显示有关内核执行状态的关键信息。方便的配置部分使用户可以为每个notebook设置依赖项,Polynote会自动在本地或从存储库中获取和加载依赖项。 Netflix写道:“未来还有许多激动人心的工作。我们对Polynote的潜力非常乐观,我们希望向社区学习,就像我们希望他们将从Polynote中获得价值一样。”

27329205033b94f20c5cab029fd0ca5f.png

6a28430eac2a7b765242fdde22e19129.gif 10cca6e70d964811f632e4b445996480.png bb429f02fa0c37f5ec66db678bfa2097.png 48d3d13bf10ba2cad4d9e66b2a683415.png 72bbe3b618a17cfc6a9a0a9c60f7e1e6.gif

据说在看的没有BUG

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值