【hive】(电影推荐系统的数据)在hive中创表,并导入数据,同时取出自己想要的数据

目标

将本地表导入hive中,并完成一系列的查询
我这里一共有四个表,分别是 movies ratings tags links,分别如下
在这里插入图片描述

一、在HDFS中创建文件夹

在这里插入图片描述

二、将本地的四张表上传到新建文件夹中,并检验是否成功导入

在这里插入图片描述在这里插入图片描述

三、在hive中创表,并将数据导入

1.查有哪些数据库,接着创建新的数据库,并使用相应数据库

在这里插入图片描述

2.创表并导入数据

(1.1)创建第一个表 movie表
在这里插入图片描述(1.2)将HDFS中movie文件的数据导入 movie表中,并查看前10条数据检验结果
在这里插入图片描述(1.3)查询出movie表中有多少条数据 用count计数
在这里插入图片描述(2.1)创建第二个表 ratings表,同时将HDFS中ratings文件的数据导入 ratings表中
在这里插入图片描述(2.2)查看前10条数据检验结果
在这里插入图片描述(3.1)创建第三个表 tags表,同时将HDFS中tags文件的数据导入 tags表中,并查看前10条数据检验结果
在这里插入图片描述(4.1)创建第四个表 links表,同时将HDFS中tags文件的数据导入 links表中,并查看前10条数据检验结果
在这里插入图片描述

零散知识点补充(趁老师讲的时候拍的)在这里插入图片描述在这里插入图片描述在这里插入图片描述## 用substring截取movie表中title列的年份在这里插入图片描述

在这里插入图片描述

将截取出来的年份数据加上原先的数据一起装入一个新表中(最后一列为年份数据)

在这里插入图片描述在这里插入图片描述

补充:

去表头也就是去掉第一行的信息的命令:
alter table movies_chenli set tblproperties(‘skip.header.line.count’=‘1’);

(记于大数据第一堂实践课)

  • 3
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

小易同学go

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值