大数据框架概论

大数据框架:

  • 批处理框架
  • 流处理框架
  • 混合框架

批处理框架

批处理框架数据特征:有界、持久、大量
优势:处理大量数据任务
缺点:处理时间要求高 紧急的任务
例如:Apache Hadoop

流处理框架

流处理模式框架特征:数据无边界 适合用来处理必须对变动或者峰值做出响应
优势:处理几乎无限量的数据
缺点:同一时间只能处理一条或很少量的数据
例如:Apache Storm 和 Apache Samza

混合处理框架

混合处理模式框架特征:可以同时处理批处理和流处理工作负载
优势:提供一种数据处理的通用解决方案,提供自己的继承库、项、工具。
例如:Apache Spark 和 Apache Flink

KvCluster-Redis内存数据库
Redis(Remote Dictionary Server),即远程字典服务,可用作数据库也可以用作缓存,属于nosql系列数据库(non-relational)。使用Key-Value进行存储,默认端口号:6379
类型:

  • string 字符串
  • list 链表
  • set 集合
  • zset 有序集合
  • hash 哈希类型

Redis具有丰富的功能,可以为每个键值设置存活时间(TTL),到期后会被自动删除,可以限制数据占用的最大内存空间,占满后按规则删除不需要的键。

MongoDB

MongoDB是一个基于分布式文件存储的数据库,由C++编写,为WEB应用提供数据存储的解决方案。介于关系数据库和非关系型数据库之间的产品。
优势:高性能、易部署使用、存储数据方便。
缺点:不擅长进行事物查询
采用独特的MongoDB查询方式,基于内存存储,将热数据存在物理内存中,从而达到高速读写。MongoDB侧重于对数据进行操作的应用系统,而Hadoop则侧重于对数据进行分析统计的应用。数据被分组存储在数据集中,被称为一个集合。存储在集合中的文档,被存储为键-值对的形式。

HBase

典型的面向列的分布式数据库
优势:海量数据处理,高可拓展,高性能,高可用,高效处理稀疏矩阵(NULL值不占用空间)
缺点:无索引,只支持Row key的随机访问,不支持SQL

依赖于HDFS的存储,Map Reduce 的计算,ZooKeeper的锁服务

Hive

Hive(数据仓库工具),建立在HDFS、MR上的数据仓库框架,用来进行数据提取、转化、加载,这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制,hive数据仓库工具能将结构化的数据文件映射为一张数据库表,并提供SQL查询功能,能将SQL语句转变成MapReduce任务来执行。
优势:适合大数据集批处理作业,灵活可拓展。

Hive中数据存储在HDFS中,Hive中包含数据模型:表(Table),外部表(External Table),分区(Partition),桶(Bucket)。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
大数据概论是指对海量的、复杂的、高维度的数据进行收集、处理和分析的一门学科。随着信息技术的快速发展,大量的数据被产生和积累,想要从这些数据中获得有价值的信息和洞察力,就需要借助大数据概论的方法和技术。 大数据概论主要包括以下几个方面。首先是大数据处理和存储技术,包括分布式存储系统、并行计算框架、分布式文件系统等。这些技术可以帮助我们有效地存储和处理大规模的数据。其次是数据挖掘和机器学习的方法,通过这些方法可以从大数据中发现隐藏的模式和规律,并用于预测和决策。此外,数据可视化和探索性数据分析也是大数据概论的重要内容,通过可视化技术可以将复杂的数据转化为直观的图表和可视化图像,帮助人们更好地理解和分析数据。 大数据概论在各个领域都有广泛的应用。在商业领域,大数据概论可以帮助企业分析市场趋势、预测产品需求,并进行个性化推荐和营销策略优化。在金融领域,大数据概论可以用于风险控制和反欺诈,帮助银行和保险公司降低风险和损失。在医疗领域,大数据概论可以用于疾病预测和诊断,辅助医生做出更准确的诊断和治疗方案。 总之,大数据概论是一门应用于处理和分析大数据的学科。它涵盖了数据处理和存储技术、数据挖掘和机器学习方法,以及数据可视化和探索性数据分析等方面。通过应用大数据概论的方法和技术,可以从海量的数据中提取有价值的信息和知识,为各个领域带来新的机遇和挑战。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

八缸键盘侠

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值