2021SC@SDUSC
PIG在大数据平台中的位置与作用
题主并没有上过大数据相关的课程,拿出了一份之前扫盲的时候整理的资料来带给大家
Pig是一种高级数据语言,运行于HDFS之上,是hadoop上层的衍生架构
主要的几种大数据架构及其之间的关系如下图所示
按照不同功能进行划分,一些的大数据项目可以如下所示
由上图可以看出,Pig是一种查询平台,我的资料中还有以下的引用:
简介:Pig是一种编程语言,它简化了Hadoop常见的工作任务。Pig可加载数据、表达转换数据以及存储最终结果。Pig内置的操作使得半结构化数据变得有意义(如日志文件)。同时Pig可扩展使用Java中添加的自定义数据类型并支持数据转换。
Pig最大