spark使用db（Oracle，hive）的一些注意事项

最新推荐文章于 2022-03-10 18:14:05 发布

weixin_34332427

最新推荐文章于 2022-03-10 18:14:05 发布

阅读量185

点赞数

本文链接：https://blog.csdn.net/weixin_34332427/article/details/82456227

版权

1.在spark 2中saveAsTable 时，要先spark.sql("use telemetry"),并且在save之前这个表一定不存在

否则会报save的类型不一致这个exception

2.spark在load比较大的表时，直接load会出现卡死的情况，因此可以通过多线程，分成多个时间段，每个时间段起一个线程来load数据

3.spark在使用Oracle JDBC执行Oracle sql时，应该要加上（）tmp

example:

(
select siteid, itemname, itemvalue, LASTMODIFIEDTIME
,
case when  ITEMNAME = 'EnableCloudTelepresence' and itemvalue = '1' then 'True' else 'False' end isCMR
from WBXSITECONFIG)tmp

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_34332427

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
spark使用db（Oracle，hive）的一些注意事项

1.在spark 2中saveAsTable 时，要先spark.sql("use telemetry"),并且在save之前这个表一定不存在否则会报save的类型不一致这个exception2.spark在load比较大的表时，直接load会出现卡死的情况，因此可以通过多线程，分成多个时间段，每个时间段起一个线程来load数据3.spark在使用Oracle JDBC执行Oracle...
复制链接

扫一扫