1apache hive大数据时代的数据仓库软件;开源数据仓库系统
借助hadoop实现了存储数据和分析数据;利用HDFS存储数据,MapReduce查询分析数据;
apache hive 可以将存储在hadoop文件中的结构化半结构化数据映射为一张数据表,基于表提供了一种查询模型,Hive查询语言,访问和分析存储在hadoop中的大型数据集
hive的核心是将HQL转换为MapReduce程序,然后将程序提交到hadoop群集执行
2使用hive的好处
采取的语言类似SQL,简单易上手
避免直接写mapreduce程序,减少开发人员学习成本
3数据文件和表之间的映射,是指数据文件和表的对应关系