spark+hive+hdfs windows开发环境配置：

最新推荐文章于 2024-04-13 14:08:36 发布

swcj

最新推荐文章于 2024-04-13 14:08:36 发布

阅读量2.1k

点赞数

本文链接：https://blog.csdn.net/swcj/article/details/49783277

版权

典型配置：spark在linux中以standalone方式运行,配置参数如下：“spark-env配置参数 ”。在windows idea中编辑代码，运行driver，连接远程master，运行程序，可同步运行查看日志，可单步调试如果连接hive需要在本机src中配置hive-site.xml中的 hive.metastore.uris配置本地hadoop_home，下载winu

摘要由CSDN通过智能技术生成

典型配置：

spark在linux中以standalone方式运行,配置参数如下：“spark-env配置参数 ”。
在windows idea中编辑代码，运行driver，连接远程master，运行程序，可同步运行查看日志，可单步调试
如果连接hive需要在本机src中配置hive-site.xml中的 hive.metastore.uris
配置本地hadoop_home，下载winutils.exe，拷贝到hadoop_home/bin
参照下面虚拟机中运行步骤7-9
如果多网卡，则需在本机配置SPARK_LOCAL_IP=集群里ip
在低配置机器上运行idea 有可能导致内存溢出，需要指定程序运行内存： -Xms128m -Xmx512m -XX:PermSize=250m -XX:MaxPermSize=512m

windows 需要配置环境变量 HADOOP_HOME ，HADOOP_USER_NAME

HADOOP_HOME=D:\hadoop-2.6.0

HADOOP_USER_NAME=hdfs

SPARK_LOCAL_IP =127.0.0.1

需要重启电脑生效

spark-env配置参数：

# Where the pid file is stored. (Default: /tmp) 用于后台运行spark

export SPARK_PID_DIR=/var/run/spark

# A string representing this instance of spark.(Default: $USER)
SPARK_IDENT_STRING=$USER

export HADOOP_HOME=${HADOOP_HOME:-/usr/hdp/current/hadoop-client}
export HADOOP_CONF_DIR=${HADOOP_CONF_DIR:-/usr/hdp/current/hadoop-client/conf}

# The java implementation to use.

export JAVA_HOME=/usr/java/jdk1.7.0_67

export SPARK_MASTER_IP=master1

最低0.47元/天解锁文章

swcj

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
spark+hive+hdfs windows开发环境配置：

典型配置：spark在linux中以standalone方式运行,配置参数如下：“spark-env配置参数 ”。在windows idea中编辑代码，运行driver，连接远程master，运行程序，可同步运行查看日志，可单步调试如果连接hive需要在本机src中配置hive-site.xml中的 hive.metastore.uris配置本地hadoop_home，下载winu
复制链接

扫一扫