java spark 读取csv_java-CSV内容被Spark读取为null

最新推荐文章于 2021-11-25 21:30:37 发布

WebQueen

最新推荐文章于 2021-11-25 21:30:37 发布

阅读量384

点赞数

文章标签： java spark 读取csv

本文链接：https://blog.csdn.net/weixin_31720227/article/details/114091807

版权

我正在尝试读取CSV文件,以便可以使用Spark SQL查询它. CSV如下所示：

16;10;9/6/2018

CSV文件不包含标题,但是我们知道第一列是部门代码,第二列是建筑代码,第三列是格式为m / d / YYYY的日期.

我编写了以下代码以使用自定义架构加载CSV文件：

StructType sch = DataTypes.createStructType(new StructField[] {

DataTypes.createStructField("department",DataTypes.IntegerType,true),DataTypes.createStructField("building",false),DataTypes.createStructField("date",DataTypes.DateType,});

Dataset csvLoad = sparkSession.read().format("csv")

.option("delimiter",";")

.schema(sch)

.option("header","false")

.load(somefilePath);

csvLoad.show(2);

当我使用csvLoad.show(2)时,仅显示以下输出：

|department|building|date|

+----------+---------+---+

|null |null |null |

谁能告诉我代码中有什么问题吗？我正在使用spark 2.4版本.

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

WebQueen

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
java spark 读取csv_java-CSV内容被Spark读取为null

我正在尝试读取CSV文件,以便可以使用Spark SQL查询它. CSV如下所示：16;10;9/6/2018CSV文件不包含标题,但是我们知道第一列是部门代码,第二列是建筑代码,第三列是格式为m / d / YYYY的日期.我编写了以下代码以使用自定义架构加载CSV文件：StructType sch = DataTypes.createStructType(new StructField[] {...
复制链接

扫一扫