~~~猿码~~~-CSDN博客

原创 Spark & Hive集成

Spark & Hive集成代码修改hive-site.xml <property> <name>javax.jdo.option.ConnectionURL</name> <value>jdbc:mysql://CentOS:3306/hive?createDatabaseIfNotExist=true</value> </property> <property> <name>ja

2020-11-04 21:20:46 56

List item Apache Spark 概述 Spark是一个快如闪电的统一分析引擎（计算框架）用于大规模数据集的处理。Spark在做数据的批处理计算，计算性能大约是Hadoop MapReduce的10~100倍，因为Spark使用比较先进的基于DAG任务调度，可以将一个任务拆分成若干个阶段，然后将这些阶段分批次交给集群计算节点处理。 [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-0cFwIGjI-1604494897957)(assets/image-20200.

2020-11-04 21:06:32 350

原创 Spark jars依赖问题

Spark jars依赖问题 1、可以使用–packages或者–jars解决依赖问题 [root@CentOS ~]# spark-submit --master spark://CentOS:7077 --deploy-mode client --class com.baizhi.outputs.SparkWordCountApplication --name RedisSinkDemo --total-executor-cores 6 --packages redis.clients:jedi..

2020-10-29 17:31:31 597

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

weixin_45361602的博客

原创 Spark & Hive集成

原创 Spark 内存计算

原创 Spark jars依赖问题

空空如也

空空如也