spark3.3.x处理excel数据

最新推荐文章于 2024-08-21 09:11:33 发布

就发个快递

最新推荐文章于 2024-08-21 09:11:33 发布

阅读量1.7k

点赞数

文章标签： spark excel

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/jkllb123/article/details/134039874

版权

环境:
spark3.3.x
scala2.12.x
引用:
spark-shell --jars spark-excel_2.12-3.3.1_0.18.5.jar
或项目里配置pom.xml

<!-- https://mvnrepository.com/artifact/com.crealytics/spark-excel -->
<dependency>
    <groupId>com.crealytics</groupId>
    <artifactId>spark-excel_2.12</artifactId>
    <version>3.3.1_0.18.5</version>
</dependency>

代码:
1、直接使用excel文件第一行作为schema

val df = spark.read
     .format("com.crealytics.spark.excel")
//     .format("excel") // 该版本的包直接写"excel"也可以
     .option("header", "true") // 该版本的包将useHeader改成了header
     .load(filePath)

2、使用自定义schema（该方法如果excel文件第一行不是所需数据，需手动限制读取的数据范围）

// 自定义schema
val schema = StructType(List(
    StructField("uid", StringType, nullable = true),
    StructField("name", StringType, nullable = true)
))

val df = spark.read
     .format("com.crealytics.spark.excel")
//     .format("excel") // 该版本的包直接写"excel"也可以
     .option("header", "false") // 使用自定义schema,所以设置为false
     .option("dataAddress", "'Sheet1'!A2:B2") // 限制读取的数据范围（也可以不加:B2就是取从A列往后的所有列）
     .schema(schema)
     .load(filePath)

ps:刚开始用的3.3.3_0.20.1这个版本的不可用，具体报啥错忘了，降到3.3.1_0.18.5该版本正常

就发个快递

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

就发个快递 CSDN认证博客专家 CSDN认证企业博客

码龄8年

23: 原创

19万+: 周排名

72万+: 总排名

8万+: 访问

: 等级

564: 积分

5: 粉丝

30: 获赞

9: 评论

70: 收藏

私信

关注

热门文章

分类专栏

flink 1篇
spark 1篇
配置文件 1篇
phoenix 1篇
理工oj 1篇
c语言 1篇
java 18篇
三元运算符 1篇
for循环 5篇
markdown 1篇
csdn 1篇
数组 5篇
算法 2篇
排序 1篇
随机数 2篇
正则表达式 1篇
类型转换 1篇
集合 4篇
遍历 1篇
LeetCode 7篇

最新评论

比较全面完整的log4j配置
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)增加内容的多样性(例如使用标准目录、标题、图片、链接、表格等元素)；(2)使用更多的站内链接；(3)文章不宜太短。
flink1.13.2运行错误问题
衿.: 在flink-conf.yaml中添加管用，感谢
flink1.13.2运行错误问题
paulgeorge9527: 楼主有没有遇过flink中，指定用户不生效，不管是代码指定，还是环境变量中指定都不生效，困住好久了，感谢
Java将String型字符串转换成int型（或int型数组）
李念1889: try catch
Java将String型字符串转换成int型（或int型数组）
就发个快递回复 weixin_43892890: 带符号的都不是个int 实在想把除了符号外的其他数值转int就用charAt每个字符做下判断

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。