对于流量密集型的业务来讲,在创业初期,最头疼的就是数据库的管理,以及大量流量带来的高额账单。然而,ScraperAPI 通过结合使用 DigitalOcean 的 Droplet、托管数据库、应用托管服务和 Kubernetes,一箭三雕,不仅减轻了数据库的管理复杂度,加快了新功能的上线部署,还只用了在大厂那里需要支付的费用的 1/3。
精益团队如何使用托管数据库
ScraperAPI 是一个致力于让公共数据收集变得简单的服务,他们多年来一直在使用 DigitalOcean 的基础设施。最初使用 DigitalOcean 的 Droplets 云主机和托管数据库,ScraperAPI 现在也在利用 DigitalOcean 应用托管(App Platform)实现快速部署和轻松扩展,以及 DigitalOcean Kubernetes 来处理更进一步的基础设施配置,这让他们能够在减少基础设施管理时间的同时,推出更多产品功能。
作为一个已经实现盈利的创业公司,ScraperAPI 提供了一个易于使用的 API,用于大规模地从互联网上收集公开数据。用户利用 ScraperAPI 可以进行电商价格分析、搜索引擎数据收集、训练人工智能模型等。
ScraperAPI 多年来一直是 DigitalOcean 托管数据库的重度用户。在加入 ScraperAPI 之前,首席技术官 Zoltan Bettenbuk 在之前的职位上有着多年的数据库经验,他发现公司自行管理数据库是一项负担繁重的任务。Zoltan 分享道:“自行管理数据库的压力是非常大的。你要确保公司数据始终安全、可用、有备份和有故障转移,因为数据是公司最重要的资产。坦白地说,我再也不希望公司自行管理数据库了。”
为了寻找更好的解决方案,ScraperAPI 采用了 DigitalOcean 的托管数据库,包括 PostgreSQL 托管数据库和 Redis 托管数据库。这一转变让他们能够轻松地扩展数据库操作。Zoltan 说:“这里最棒的是,如果我想扩展到两倍,我可以在大约一分钟内完成。”
通过应用托管和 Kubernetes 快速部署
在被另一家公司收购后,ScraperAPI 希望将他们在托管数据库中体验到的“效率提升”扩展到他们的技术栈的其他部分,于是开始探索 DigitalOcean 的应用托管服务(App Platform),它是 DigitalOcean 的一个 PaaS 解决方案,可以为他们的部署流程提效。Zoltan 回忆到这一变化时表示:“我们发现,使用应用托管服务将新功能或服务推向市场要快得多,也容易得多。这真的只是几分钟的事情。”这种快速部署能力使 ScraperAPI 能够迅速创新和推出新功能。
高效是应用托管服务给 ScraperAPI 带来的主要优势之一,它使新功能在几分钟内就能上线。Zoltan 强调了其易用性,他说:“从工程师写下最后一行代码到功能上线,实际上只需要 2-3 分钟。”
应用托管服务已经成为 ScraperAPI 新服务的孵化器。最初在应用托管服务上部署功能,允许快速开发和测试。当功能扩展并需要更强大的基础设施时,它们就会转移到 Kubernetes 托管服务上,以实现更有效的资源管理,并获得更强的性能。这种方法使 ScraperAPI 能够在保持可扩展的基础设施的同时推出更多功能。
此外,ScraperAPI 还能够平衡关键工作负载中高级功能的使用,并为要求较低的任务提供更具成本效益的解决方案。由于 ScraperAPI 的业务是带宽密集型业务,他们也非常欣赏 DigitalOcean 通过 Droplets 和应用托管服务为客户提供的带宽量,并估计“由于我们处理的数据量如此之大,在 AWS 上的花费可能会是现在的 3 倍。”
ScraperAPI 的年收入增长率达到 30-35%,并且正在将业务重心扩展到有结构化数据需求的企业客户。DigitalOcean 的托管数据库、应用托管服务和 Kubernetes 托管服务,这一产品组合对其成功起到了关键作用。随着业务的增长,他们也很满意 DigitalOcean 提供的技术支持,并表示“总的来说,基本上在我们需要的时候,DigitalOcean 的支持都在。这即便是在更大的供应商那里,通常是得不到这么好的技术支持的。”
ScraperAPI 团队期待 DigitalOcean 为应用托管服务推出更多的功能,并将继续利用 PaaS 解决方案作为快速部署新想法、新功能的方式。Zoltan 也在开展新项目,如初创公司 SendStreak,他很高兴能够继续利用 DigitalOcean 解决方案的简单性和易于部署的特性,用在这些新的业务上。