指定数据schema,代码如下:
from pyspark.sql.types import *
# 指定DataFrame每个列的模式
schema = StructType([
StructField('id', LongType(),True),
StructField('电站',StringType(),True),
StructField("跟踪器",StringType(),True),
StructField("时间",StringType(),True),
StructField("工作模式", LongType(),True),
StructField("太阳高度角", DoubleType(),True),
StructField("太阳方位角", DoubleType(),True),
StructField("高度角1", DoubleType(),True),
StructField("方位角1", DoubleType(),True),
StructField("高度角2", DoubleType(),True),
StructField("方位角2", DoubleType(),True),
StructField("高度角3", DoubleType(),True),
StructField("方位角3", DoubleType(),True),
StructField("电机1电流", LongType(),True),
StructField("电机2电流", LongType(),True),
StructField("电机3电流", LongType(),True),
StructField(