- 博客(4)
- 收藏
- 关注
原创 大数据——Hive
Hive是一个基于Haddoop的数据仓库,可以把结构化的数据文件映射为一张表,并提供类SQL的查询功能。Hive是建立在Hadoop之上的,所有的Hive的数据都是存储在HDFS中的,本质是:将HQLMapReduce1)Hive处理的数据存储在HDFS2)Hive分析数据底层实现是MapReduce(1)Hive的数据存储在HDFS上面(2)计算引擎是MapReduce可以修改Hive的计算引擎:Tez,Spark:关系型数据库,主要目的是保护业务数据的完整性。
2023-08-03 16:02:46 97
原创 数据分析开发
HDFS(Hadoop Distributed File System),它是一个文件系统,用于存储文件,通过目录树来定位文件;其次,它是分布的,由很多服务器联合起来实现其功能,集群中的服务器有各自的角色。
2023-08-01 15:40:04 109 1
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人