【大数据技术】实验3:熟悉常用的Hive操作


一、实验环境

  1. 操作系统:Linux(与实验1保持一致);
  2. Hadoop版本:3.3.1;
  3. JDK版本:1.8;
  4. Hive版本:3.1.2

二、实验内容

安装Hive环境

  1. 完成Hive安装,根据实验1所安装的Hadoop模式,选择Hive的配置模式;
  2. 将Hive的配置文件详细清单列出;
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

HiveQL练习

classid
dz1955001001
dz1955001001
dz1955001002
dz1955001002
dz1955002001
dz1955002001
dz1955002002
dz1955002002
dz1955003001
dz1955003001
dz1955003002
dz1955003002
dz1955004001
dz1955004001
dz1955004002
dz1955004002
完成以下操作:
1.创建数据库(自己命名),score为内部表,unit_name为外部表,并加载数据。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
2.查询所有同学的语数英成绩
在这里插入图片描述
3.查看score表前十行数据
在这里插入图片描述
4.查看score表中不同的班级号
在这里插入图片描述
5.查看数学成绩及格的所有同学信息
在这里插入图片描述
6.查看各个班英语、数学成绩平均分
在这里插入图片描述
7.查看dz1955001002班的学生及语文成绩,并降序排序
在这里插入图片描述
8.查看语文平均成绩大于80的班级
在这里插入图片描述

词频统计

重新使用实验2下载的英文短文,编写HiveQL程序,完成词频统计。要求给出代码及具体注释,程序运行结果截图。
在这里插入图片描述
在这里插入图片描述


出现的问题

1.hive的使用。

解决办法:
对于hive的使用,在hadoop集群里,先启动hadoop集群,再启动mysql服务,然后,再hive即可。
  1、在hadoop安装目录下,sbin/start-all.sh。
  2、在任何路径下,执行service mysql start (CentOS版本)、sudo /etc/init.d/mysql start (Ubuntu版本)
  3、在hive安装目录下的bin下,./hive。

  • 2
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值