hive 分区_代码 | Spark读取mongoDB数据写入Hive普通表和分区表

版本:

一、原始数据及Hive表

MongoDB数据格式

7aa6e7f249477c274fd8b382f767912e.png

Hive普通表

721c1220b9eed8c2db064eb47941a442.png

Hive分区表

c87d2bd5fccb5d5da560c934c0a7f59c.png

二、 IDEA+Maven+Java

依赖

ae6fa7db09f5b26440a57a414e54b34d.png

代码

bdb9f564970d92699d4f65fdc0d9de9c.png
237ad5882495f022398fa7d73179a643.png
24078171259807f27af01592ec3f7fff.png
ea41b2d4ae515ff52e4a2fb371f73c4d.png

工具类

3281147536bca8ec6219e4cf9c212283.png

三、 错误解决办法

1、 IDEA会获取不到Hive的数据库和表,将hive-site.xml放入resources文件中。并且将resources设置成配置文件(设置成功文件夹是蓝色否则是灰色)

file–>Project Structure–>Modules–>Source

cee1e6ebacd2b743f8cc8f21bf1ee066.png

2、 上面错误处理完后如果报JDO类型的错误,那么检查HIVE_HOME/lib下时候否mysql驱动,如果确定有,那么就是IDEA获取不到。解决方法如下:

将mysql驱动拷贝到jdk1.8.0_171.jdk/Contents/Home/jre/lib/ext路径下(jdk/jre/lib/ext)

在IDEA项目External Libraries下的<1.8>里面添加mysql驱动

e91c037cb70c0e71b5895c4b385850b0.png

四、 注意点

由于将MongoDB数据表注册成了临时表和Hive表进行了关联,所以要将MongoDB中的id字段设置成索引字段,否则性能会很慢。

MongoDB设置索引方法:

d8d47c6b2412da8e1c543c8b65da1745.png

查看索引:

b238cb978661f43db8cd9aebebe2e4a7.png
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值