- 博客(3)
- 收藏
- 关注
原创 大神讲解Azkaban VS EMR-数据开发
Azkaban EMR-数据开发 占用独立服务器,独立部署,独立运维 集成在 EMR 中,不需要部署,不需要特运维 代码文件打包成 zip,手动上传 代码文件手动上传到 OSS 一个项目下可以都多个工作流,但是必须在一个 zip 包中,上传后自动解析 flow。flow 之间无法直接依赖。 一个项目可以多个工作流,工作流之间可以互相依赖。 每个 flow 下的 job,支持 hive、shell、...
2019-05-21 14:11:36 375
原创 zookeeper curator 基本使用
下面,我们将通过一个简单的示例演示curator最基本的crud功能: maven依赖: org.apache.zookeeper zookeeper 3.4.12 <dependency> <groupId>org.apache.curator</groupId> <artifactId&...
2019-05-21 13:52:08 89
原创 大数据与Hadoop有什么关系?大数据Hadoop入门简介
学习着数据科学与大数据技术专业(简称大数据)的我们,对于“大数据”这个词是再熟悉不过了,而每当我们越去了解大数据就越发现有个词也会一直被提及那就是——Hadoop 那Hadoop与大数据有什么关系呢? 所谓 大数据 ,就是从各种类型的数据中, 快速获得有价值信息的能力 。大数据是需要新处理模式才能具有更强的决策力、洞察力和流程优化能力的海量、高增长率和多样化的信息资产。它是对那些超出正常处理范围和...
2019-05-21 13:24:57 152
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人