大数据
文章平均质量分 95
zhaojiadi1998
靡不有初,鲜克有终
lagou资料
展开
-
Hbase
HBase 基于 Google的BigTable论文而来,是一个分布式海量列式非关系型数据库系统,可以提供超大规模数据集的实时随机读写。原创 2024-04-26 11:35:42 · 1415 阅读 · 4 评论 -
hive学习
Hive是基于Hadoop的一个数据仓库工具,可以将 结构化的数据文件 映射为一张表(类似于RDBMS中的表),并提供类SQL查询功能;Hive是由Facebook开源,用于解决海量结构化日志的数据统计。- Hive本质是:将 SQL 转换为 MapReduce 的任务进行运算- 底层由HDFS来提供数据存储- 可以将Hive理解为一个:将 SQL 转换为 MapReduce 任务的工具Flume由Cloudera公司开发,是一个分布式、高可靠、高可用的海量日志采集、聚合、传输的系统。原创 2024-04-02 17:47:32 · 1247 阅读 · 0 评论