存档日期:2019年5月13日 | 首次发布:2012年4月17日
根据您的技能,偏好和要求,为大规模数据分析工作选择最合适的MapReduce实现。 MapReduce是一个简单而强大的编程模型,可轻松开发可伸缩的并行应用程序,以在大型商用机器集群上处理大量数据。 它将应用程序与运行分布式程序的详细信息隔离开。 但是,许多程序员并不熟悉MapReduce编程风格,而是喜欢使用类似SQL的语言来执行任务。 在本文中,阅读旨在解决这些问题并在MapReduce框架之上添加声明性接口的高级语言和系统的概述。
此内容不再被更新或维护。 全文以PDF格式“按原样”提供。 随着技术的飞速发展,某些内容,步骤或插图可能已更改。
翻译自: https://www.ibm.com/developerworks/opensource/library/os-mapreducesql/index.html