目录
1. 环境准备
开启虚拟机、开启hadoop集群、开启spark集群、开启spark-shell、在spark-shell中导入隐式转换包
hadoop集群 输入:start-all.sh
spark集群 输入:cd /export/servers/spark
................. 输入:sbin/start-all.sh
spark-shell 输入:bin/spark-shell --master local[2]
导包 ..........输入:import spark.imlicits._

2. 从 txt 文件创建 DataFrame
2.1 文件准备


2.2 创建DataFrame
在spark-shell中
输入:val personD

本文档详细介绍了如何在Spark环境中创建DataFrame,包括从txt文件和RDD出发的步骤,同时列举并解决了在创建过程中可能遇到的常见错误。
最低0.47元/天 解锁文章
84

被折叠的 条评论
为什么被折叠?



