Pig简介
是一种探索大规模数据集的脚本语言
PigLatin语句最终会转化为MapReduce运行
Pig与HIve区别
1、Hive像SQL语句;PigLatin像Shell语句
2、Hive更适合数据仓库的任务;Hive主要用于静态的结构以及需要经常分析的工作;
3、Pig赋予开发人员在大数据领域更多的灵活性,并允许开发简洁的的脚步用于转换数据流以便嵌入到较大的应用程序
Pig的数据模型
不要求每一行具有相同的列
如果人为将每一行设置为相同的列,这些行叫做一个关系
表可以嵌套
Pig运行
需要启动历史服务器 mr-jobhistory-daemon.sh start historyserver