大数据GP

目录

 

一、概念

二、主要解决

三、特征(4V)

四、应用场景

五、技术体系

1.数据采集

        Sqoop

        Flume

        Kafka

2.数据存储

        Hdfs

        HBase

        Redis

        Kafka

3.资源管理

        YARN

4.通用计算

        MapReduce

        Spark Core

5.数据分析

        Hive

        Spark

        Storm

        Spark Streaming

6.任务调度

        Azkaban

7.数据可视化

        Superset

8.分布式资源协调

        Zookeeper


一、概念

        传统数据处理应用软件不足以处理(存储计算)它们的大而复杂的数据集。

二、主要解决

        海量数据的存储运算问题。

三、特征(4V)

        容量大、种类多、速度快、价值高

        1.容量(volume):数据的大小决定所考虑的数据的价值和潜在的信息

        2.种类(variety):数据类型的多样性,包括:文本、图片、视频、音频
                结构化数据:可以用二维数据库表来抽象,抽取数据规律;
                半结构化数据:介于结构化和非结构化之前,主要指XML、HTML等;
                非结构化数据:不可用二维表抽象,如:图片、图像、音频、视频等

        3.速度(velocity):指获取数据的速度以及处理数据的速度
                数据的生产呈指数式爆炸式增长;
                处理数据要求的延时越来越低

        4.价值(value):合理运用大数据,一低成本创造高价值
                综合价值大,隐含价值大;
                单条数据记录无价值,无用数据多

四、应用场景

        待补充

五、技术体系

 Tips:内容变更实时更新

1.数据采集

        Sqoop

        Flume

        Kafka

2.数据存储

        Hdfs   Hadoop介绍_初心の GP的博客-CSDN博客Apache Hadoop项目是一个提供高可靠,可扩展(横向)的分布式计算的开源软件平台。允许使用简单的编程模型跨计算机集群分布式处理大型数据集。它旨在从单个服务器扩展到数千台计算机,每台计算机都提供本地计算和存储。Hadoop本身不是依靠硬件来提供高可用性,而是设计用于检测和处理应用程序层的故障,从而在计算机集群之上提供高可用性服务,每个计算机都可能容易出现故障。产生背景1.Hadoop最早起源于Nutch。Nutch的目的是构建一个大型的全网搜索引擎(网页抓取、...https://blog.csdn.net/a318199328/article/details/121611085

Hdfs总结https://blog.csdn.net/a318199328/article/details/121809545

        HBase

        Redis

        Kafka

3.资源管理

        YARN

4.通用计算

        MapReduce

        Spark Core

5.数据分析

        Hive

        Spark

        Storm

        Spark Streaming

6.任务调度

        Azkaban

7.数据可视化

        Superset

8.分布式资源协调

        Zookeeper

Zookeeper介绍_初心の GP的博客-CSDN博客icon-default.png?t=LA92https://blog.csdn.net/a318199328/article/details/121973475

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值