cascading
文章平均质量分 68
BehandTheTime
这个作者很懒,什么都没留下…
展开
-
cascading helloworld 案例
Cascading是一个数据处理的API和查询处理计划,用于定义,共享数据处理工作流,还能在单一计算节点或分布式计算集群上执行数据处理工作流。在单一计算节点,Cascading的本地模式(local mode)可以在部署到集群之前,用于测试代码和处理本地文件。在一个部署了Apache Hadoop的分布式计算集群上,Cascading在hadoop API上增加了一个抽象层,大大简化了Hadoop原创 2017-06-27 14:24:47 · 472 阅读 · 0 评论 -
Cascading——针对Hadoop MapReduce的数据处理API
Cascading是一个新式的针对Hadoop clusters的数据处理API,它使用富于表现力的API来构建复杂的处理工作流,而不是直接实现Hadoop MapReduce的算法。该处理API使开发者可以快速装配复杂的分布式流程,而无需“考虑”MapReduce。同时还可以基于流程之间的依赖及其它元数据信息来有效地进行调度。Cascading API的核心概念是管道和流。所转载 2017-08-08 09:33:18 · 504 阅读 · 0 评论