【2022新书】高效数据科学基础: 如何使数据科学家高效

14276d01995fe4c99f4e820d8e2b3e96.png

来源:专知
本文为书籍介绍,建议阅读5分钟
简化数据科学基础设施,为数据科学家提供从原型到生产的有效路径。

c567ca6a81aa78f75ecde489ab6fa38a.png

《高效数据科学基础》是为数据科学和机器学习应用程序组装基础设施的实践指南。它揭示了Netflix和其他数据驱动公司管理尖端数据基础设施的过程。

当您使用这个易于遵循的指南时,您将从头开始设置端到端基础设施,使用一个完全可定制的流程,您可以很容易地适应您的公司。您将了解如何使用现有的云基础设施、一堆开源软件和惯用的Python提高数据科学家的工作效率。在整个过程中,您将遵循以人为中心的方法,重点关注用户体验和满足数据科学家的独特需求。

第一章: 介绍

第二章: 数据科学的工具链

第三章: 介绍Metaflow

第四章: 计算层的扩展

第五章: 实践可扩展和性能

第六章: 进入生产阶段

第七章: 处理数据

第八章: 使用和运作模式

第九章: 使用完整堆栈的机器学习

机器学习和数据科学应用是人类构建的最复杂的工程产品,如果你考虑到驱动它们的全部软件和硬件堆栈的话。因此,在今天,在21世纪20年代初,构建这样的应用并不容易,这就不足为奇了。机器学习和数据科学将继续存在。由高级数据驱动技术驱动的应用程序在各个行业中越来越普遍。因此,显然需要使构建和操作这样的应用程序成为一个更轻松、更有纪律的过程。引用阿尔弗雷德·怀特黑德的话:“文明的进步是通过扩展我们无需思考就能执行的重要操作的数量。”这本书教你如何构建一个有效的数据科学基础设施,它允许用户试验创新的应用,将它们部署到生产中,并不断改进它们,而不需要过多考虑技术细节。没有一种千篇一律的方法可以适用于所有的用例。因此,本书关注的是通用的、基本的原则和组件,这些原则和组件可以在您的环境中以一种有意义的方式实现。

https://www.manning.com/books/effective-data-science-infrastructure#:~:text=Effective%20Data%20Science%20Infrastructure%3A%20How,their%20cutting%20edge%20data%20infrastructure.

752cabb3fd40ae473ebdc8bf3c395942.png

f9452c56079c7e87d95ad8af21681543.png

bd4d513d5f87266d8cc7b526bd482fcc.png

c9159371009a3c1a4dbf32f7cf99a971.png

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值