大数据
文章平均质量分 72
code在飞
这个作者很懒,什么都没留下…
展开
-
CDH6.3.2集成dolphinscheduler3.0.1伪集群模式
CDH6.3.2集成dolphinscheduler原创 2023-08-18 12:36:46 · 289 阅读 · 0 评论 -
cloudera manager CDH6.3.2集成streamsets
streamsets产品是一个做大数据ETL的工具,支持包括结构化和半/非结构化数据源,拖拽式的可视化数据流程设计界面。而Streamsets旗下有如下三个产品: streamsets data collector(核心产品,开源):大数据ETL工具;streamsets control hub(收费项目):可以将collector编辑好的pipeline放入control hub进行管理,可实现定时调度、管理和pipeline拓扑;manifest.json(可以不放置)原创 2023-03-31 17:39:27 · 225 阅读 · 0 评论 -
spark零基础 到WordCount编程
Spark原创 2023-03-14 16:25:22 · 1221 阅读 · 1 评论