这个对于pig意味这什么?
pig首先是一个apache的项目,他会帮助pig的开发者阅读本篇,了解pig未来的发展方向。
pigs吃任何东西
pig可以对任何数据进行操作,不管数据是否具备元数据。他可以处理非结构化的,嵌套的以及有联系的数据。他也可以通过扩展处理键值存储的数据,以及数据库中数据等。
pigs可以生活在任何地方
pig的目的是可以并行处理数据的语言。他可以不依赖并行处理框架,虽然他已经再hadoop上面实现相关的功能,但未来会支持在非hadoop环境,对数据进行并行处理。
pigs是家禽
pig可以很好的被用户进行设计与开发。用户可以通过java,python,js等进行自己的扩展,同时,支持用户进行装载(load)与存储(store)的功能,实现实际的函数库。
pig latin更好的帮助用户优化map/reduce的job,并具有更好的效率。
pigs 飞起来
pig可以快速处理数据,但是现在在这方面的权衡做的还不够完善,已pig的重量来说,现在还飞不起来。
- 原文网址: apache pig的哲学
- 请我喝咖啡
- 版权声明:自由转载-非商用-非衍生-保持署名 | Creative Commons BY-NC-ND 3.0