大数据架构基本逻辑梳理

本文深入探讨大数据架构的核心逻辑,围绕Value、Velocity、Variety和Volume四大要素展开。强调了分布式保存在处理大量数据时的重要性,同时讨论了数据可靠性,包括故障检测、冗余备份和数据一致性。此外,还关注了数据访问速度的提升,提倡避免数据移动并推动计算靠近数据存储,以及实现处理的并行化。
摘要由CSDN通过智能技术生成
大数据架构基本逻辑梳理
流处理、批处理、交互式查询之间区别在文末
大数据的特点
  • Value(价值) Velocity(速度) Variety(多样性) Volume(体量)

大数据处理主要解决两个问题。 数据保存,数据操作 。以及处理结果的展现。其特点是:
数据单向增加。 删除和修改很少。Write-once-read-many
数据形态多样。
数据价值随时间递减。 实时数据价值最大,历史数据虽然有价值但会降低
数据在一个或多个数据中心的集群的大量机器中保存。 读写太多,导致硬件发生故障率升高。

数据保存涉涉及到两个问题: 数据的表达和数据的存储
鉴于大数据形态的多样性,很难用一种统一的结构化方法对数据建模。现在采用的基本策略都是用一个 统一的大表(Bigtable)来保存。在大表中,所有的数据(包括键值)都以字符串的形式保存 ,将字符串的内部格式的控制权交给该数据的用户。该方案在简化数据模型的同时,也增加了数据用户的负担。 在Hadoop中也有它的对应的解决技术:
  • 1
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值