spark进行数据清洗时,如何读取xlsx表格类型文件
首先可以确定的是spark有专门对应excel表格读取的工具,在用spark-sql对xlsx类型文件进行读取的时候只需要再pom.xml文件里添加依赖就可以了添加依赖如下<!-- 读取excel xlsx--> <dependency> <groupId>com.crealytics</groupId> <artifactId>spark-excel_2.11</artifactId>
原创
2021-02-19 20:49:24 ·
2111 阅读 ·
1 评论