什么是HIVE
hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供完整的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。hive参考手册
什么是pig
pig是在HDFS和MapReduce之上的数据流处理语言(脚本语言),它将数据流处理翻译成多个MapReduce函数,提供更高层次的抽象将程序员从具体的编程中解放出来。pig参考手册
不同的方式做同样的事情(Two ways of doing same thing)
1、都是使用高层次的语言生成MapReduce任务
2、都使Users不用了解MapReduce与HDFS的细节