Hadoop
业余草
这个作者很懒,什么都没留下…
展开
-
hadoop 各种概念整理
HadoopHadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS。HDFS有高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上;而且它提供高吞吐量(high throughput)来访问应用程序的数据,适合那些有着超大数据集(large data set)的应用程序。HDFS放宽了(relax)POSIX的要求,...原创 2018-09-15 19:57:31 · 741 阅读 · 0 评论 -
hive核心基本概念
1.什么是hive基于 Hadoop 的一个数据仓库工具:hive本身不提供数据存储功能,使用HDFS做数据存储,hive也不分布式计算框架,hive的核心工作就是把sql语句翻译成MR程序hive也不提供资源调度系统,也是默认由Hadoop当中YARN集群来调度可以将结构化的数据映射为一张数据库表,并提供 HQL(Hive SQL)查询功能2.hive和Hadoop关系 ...原创 2018-09-20 14:03:04 · 536 阅读 · 0 评论