中文编码错乱如图:
解决方法:读取文本文件时,以spark.sparkContext.hadoopFile方法,对字符串的编码进行转换
import org.apache.hadoop.io.{
LongWritable, Text}
import org.apache.hadoop.mapred.TextInputFormat
import org.apache.spark.rdd.RDD
import org.apache.spark.sql.{
DataFrame, SparkSession}
object spark_first{
def main(args: Array[String])