软件环境:Hadoop2.7分布式集群环境
开发环境与工具:(1)Windows 10 (2)Centos6.7
192.168.213.70---master
192.168.213.71---slave1
192.168.213.72---slave2
(1)准备Spark安装包
上传文件
文件解压缩
(2)编辑profile
刷新配置
(3)spark-shell运行
Web UI监控页面访问
输入scala代码进行调试
(4)入门案例WordCount
检查是否配置hdfs读取
上传文件到centos
上传文件到hdfs中
测试
结果写入到hdfs中