大数据
文章平均质量分 93
学点大数据
TracyCoder123
每一行代码都是迈向成功的阶梯
展开
-
大数据之路书摘:走近大数据——从阿里巴巴学习大数据系统体系架构
StreamCompute 是网里巴巴自主研发的流式大数据平台,在内部较好地支持了阿里巴巴流式计算需求: OneData 是数据整合及管理的方法体系和工具,阿里巴巴的大数据工程师在这一体系下,构建统一、规范、可共享的全域数据体系 ,避免数据的冗余和重复建设 ,规避数据烟囱和不一致性,充分发挥间里巴巴在大数据海量、多样性方面的独特优势。无序、无结构的数据犹如堆积如山的垃圾,给企业带来的是令人咋舌的高额成本,给数据采集、存储和计算都带来了极大的挑战。的数据作为数据源,对外通过接口的方式提供数据服务,主要提供。原创 2023-06-16 17:02:35 · 1750 阅读 · 0 评论 -
大数据之路:走近大数据——什么是大数据、数仓的概念、计算架构的发展
大数据是指无法在有限时间内用常规软件工具对其进行获取、存储、管理和处理的数据集合。海量化:数据量规模巨大多样性:数据源和数据种类具有多样性快速化:数据产生和处理的速度很快价值化:数据的价值密度低,但整体价值高大数据体系:流式处理、批式处理、实时处理:静态数据集、离线计算、非实时、小时/天等周期性计算。批处理系统可以存取已经入库的所有数据,人们可以对数据进行复杂深入的分析,分析处理的延迟以分钟或者小时计。批处理是最通用的数据处理模式。原创 2023-05-05 17:33:47 · 701 阅读 · 0 评论