项目场景: saprk使用sampleByKey对数据进行分层抽样 问题描述 在进行最后进行分层抽样数据结果时出现报错 scala> exactSample.collect().foreach(println) java.lang.ArrayIndexOutOfBoundsException:1 原因分析: 检查前面代码没有出现问题,在检查导入数据集发现多了两行空行 解决方案: 删除两行空行 再次导入数据集,问题解决