大数据
文章平均质量分 91
大数据(big data),IT行业术语,是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
肥叔菌
本博客主要用于记录学习过程中的笔记,每隔一段时间,博主将会将精华内容整合发到知乎、简书上。欢迎关注博主肥叔菌在其他平台上的账号,谢谢。
B站:https://space.bilibili.com/456254145
segmentfault:https://segmentfault.com/u/feishujun/articles
简书:https://www.jianshu.com/u/67bab078551a
展开
-
Assembling a Query Engine From Spare Parts
构建一个新的云数据仓库是一项艰巨的挑战,需要对查询引擎和周围的云基础设施进行大量投资。考虑到成熟的空间,作为一家小型初创公司进入市场似乎是一项艰巨的任务。在Firebolt,我们在不到18个月的时间里组装了一个可工作的高性能云数据仓库。我们通过在现有项目的基础上构建查询引擎,然后在差异化功能上投入巨资来实现这一点。本文介绍了我们的决策过程和经验教训。原创 2023-10-20 00:00:00 · 349 阅读 · 0 评论 -
Apache DolphinScheduler 安装部署
Apache DolphinScheduler是一个分布式去中心化,易扩展的可视化DAG工作流任务调度平台。致力于解决数据处理流程中错综复杂的依赖关系,使调度系统在数据处理流程中开箱即用架构。原创 2023-03-21 00:00:00 · 534 阅读 · 0 评论