![](https://img-blog.csdnimg.cn/20201014180756918.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
大数据
文章平均质量分 95
大数据的知识,框架
coldstarry
这个作者很懒,什么都没留下…
展开
-
sheng的学习笔记-hive框架原理
Hive是基于Hadoop的一个数据仓库(Data Aarehouse,简称数仓、DW),可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能。是用于存储、分析、报告的数据系统,常用作离线数据仓库Hive的本质是:将Hive SQL转化成MapReduce程序,其灵活性和扩展性比较好,支持UDF,自定义存储格式等;适合离线数据处理。Hive分区是把数据按照某个属性分成不同的数据子集。在Hive中,数据被存储在HDFS中,每个分区实际上对应HDFS下的一个文件夹。原创 2024-06-26 23:22:19 · 945 阅读 · 1 评论 -
sheng的学习笔记-hadoop,MapReduce,yarn,hdfs框架原理
hadoop,mapreduce,yarn,hdfs原创 2024-06-26 23:19:52 · 1073 阅读 · 0 评论