大数据基础入门一

最新推荐文章于 2024-08-20 15:12:15 发布

只会摆烂的小亮

最新推荐文章于 2024-08-20 15:12:15 发布

阅读量637

点赞数

文章标签： hbase hadoop hive zookeeper

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_62725661/article/details/127408992

版权

大数据概述

大数据（Big Data）：无法用现有的软件工具提取、存储、处理的海量复杂的数据结合

特点：4V

Volume：数据量大，数据体量巨大 TB->PB

Variety：数据类型繁多

Value：价值密度低。价值密度高低与数据总量的大小成反比

Velocity：处理数据的速度快

Hadoop（Doug Cutting）

定义：由Apache基金会所开发的分布式系统基础架构（受到Map/Reduce和Google File System（GFS）的启发）
核心架构：
- MapReduce编程模式
  
  MapReduce 框架把一个应用程序分解为许多并行计算指令
  - Map：切分大的数据
  - Reduce：合并Map计算的结果
- HDFS分布式文件系统
  
  为大量数据提供存储服务，拆分文件为块（128MB）
  - 特点：
    - 多节点存放
    - 高吞吐量
    - 高容错性

Hbase

定义：由Apache开源KV数据库，建立于HDFS上，高可靠、高性能、列存储、可伸缩、实时读写的数据库系统

介于NoSQL和RDBMS之间

仅能通过主键row key和主键的range检索数据、仅支持单行事务

主要用于存储非结构化和半结构化的松散数据
依靠横向扩展，通过增加廉价服务器增加计算和存储能力
Hbase表
- 特点
  - 数据量大
  - 面向列族的存储和权限控制，列单独检索
  - 表的设计稀疏，对于NULL的列不占存储空间

Hive

定义：Hive数据仓库提供对存储在分布式的数据的查询和管理，建立于Hadoop上
功能：
- 对数据进行提取/转化/加载ETL
- 存储、查询和分析存储在HDFS(HBASE)的大规模数据的机制
- 将SQL转化为MapReduce在Hadoop上运行进行数据统计处理
缺点：
- Hive不支持事务
- 对表无法修改
- 查询速度慢

只会摆烂的小亮 CSDN认证博客专家 CSDN认证企业博客

码龄3年

5: 原创

132万+: 周排名

30万+: 总排名

7614: 访问

: 等级

106: 积分

19: 粉丝

49: 获赞

10: 评论

69: 收藏

私信

关注

热门文章

分类专栏

三维重建 2篇
大数据 2篇

最新评论

Mip-Splatting复现过程记录
Summer_JHUN: 数据集下载不了啊qwq怎么办
Mip-Splatting复现过程记录
上课玩手机。。: 你有解决办法了吗兄弟
Mip-Splatting复现过程记录
Summer_JHUN: 确实，这个数据集怎么不能下载，如果下载第二个数据集的话文件里面又缺少json文件又不能用，官网的下载链接打开也是空的，
Mip-Splatting复现过程记录
上课玩手机。。: 大佬，请文为什么Blender Dataset这个数据集下载显示文件夹为空啊？还有Mip-NeRF 360 Dataset这两个数据集中的DatasetPt.1为什么不能下载啊？
Mip-Splatting复现过程记录
m0_54832776: Training progress: 0%| | 0/30000 [00:00<?, ?it/s]Traceback (most recent call last): File "train.py", line 268, in <module> training(lp.extract(args), op.extract(args), pp.extract(args), args.test_iterations, args.save_iterations, args.checkpoint_iterations, args.start_checkpoint, args.debug_from) File "train.py", line 125, in training render_pkg = render(viewpoint_cam, gaussians, pipe, background, kernel_size=dataset.kernel_size, subpixel_offset=subpixel_offset) TypeError: render() got an unexpected keyword argument 'kernel_size' Training progress: 0%|

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。