大数据
文章平均质量分 94
i-code
这个作者很懒,什么都没留下…
展开
-
大数据工具之DataX
DataX简介DataX框架设计DataX3.0插件体系工具部署三种案例实操stream2mysqlmysql2hdfs拓展DataX简介DataX 是阿里巴巴集团内被广泛使用的离线数据同步工具/平台,实现包括 MySQL、Oracle、SqlServer、Postgre、HDFS、Hive、ADS、HBase、TableStore(OTS)、MaxCompute(OD...原创 2019-11-22 10:41:00 · 799 阅读 · 0 评论 -
Spark面试题
Spark面试题为什么考察Spark?精选考题导入为什么考察Spark?Spark作为大数据组件中的执行引擎,具备以下优势特性。高效性。内存计算下,Spark 比 MapReduce 快100倍。Spark使用最先进的DAG调度程序、查询优化程序和物理执行引擎,实现批量和流式数据的高性能。易用性。Spark支持Java、Python和Scala的API,还支持超过80种高级算法,使用户可...原创 2019-09-27 14:25:19 · 830 阅读 · 0 评论