Hadoop学习-hive的安装和命令行使用和java操作

本文将详细介绍如何在Hadoop环境中安装Hive,包括配置步骤和验证安装的过程。接着,我们将探讨Hive的命令行使用,包括创建表、加载数据和执行查询的基本操作。最后,我们将展示如何通过Java API与Hive进行交互,实现程序化的数据处理任务。
摘要由CSDN通过智能技术生成

Hive的用处,就是把hdfs里的文件建立映射转化成数据库的表

但hive里的sql语句都是转化成了mapruduce来对hdfs里的数据进行处理

,并不是真正的在数据库里进行了操作。

而那些表的定义则是储存在了mysql数据库中,他只是记录相应表的定义

所以你的集群中要有一台机器装了mysql

装hive,装到哪都行

然后解压tar –zxvf xxxxx –C apps

然后进入到这个目录里下的conf里

创建hive-site.xml文件

告诉他mysql在哪,连接驱动是啥,用户名和密码

然后进入lib目录下,把jdbc jar 包放到该目录下

然后是启动hive

你的hadoop和hive要配置的有环境变量

echo $PATH   //可以查看配置的环境变量

echo $HADOOP-HOME //可以查看具体的哪一个

然后最好把hadoop和yarn都启动起来

然后再安装目录里bin/hive就可以启动了

默认的是default数据库

创建数据库和表都会在真正的hdfs里面创建目录

然后如果你要是想往表里面导数据,你需要把相应的文件用 ^A 来分割放到hdfs里的相应目录下

然后把这个文件上传到hdfs里面

  hadoop fs  -put stu.info /user/hive/warehouse/t_big24/

在hive交互页面中,显示当前库

设置一些基本参数,让hive使用起来更便捷,比如:

1、让提示符显示当前库:

hive>set hive.cli.print.current.db=true;

2、显示查询结果时显示字段名称:

hive>set hive.cli.print.header=true;

但是这样设置只对当前会话有效,重启hive会话后就失效,解决办法:

在linux的当前用户目录中,编辑一个.hiverc文件,将参数写入其中:

vi .hiverc

set hive.cli.print.header=true;

set hive.cli.print.current.db=true;

配置hive环境变量

比如我hive是解压在  /root/apps/hive-1.2.1

Vi /etc/profile

然后在最后加上

Export HIVE_HOME=/root/apps/hive-1.2.1

Export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$HIVE_HOME/bin

还可以把hive当成一个服务,使用客户端来访问这个服务

服务端口号10000

启动hive服务

bin/hiveserver2

然后可以在linux监听端口号netstat -nltp

启动成功后,可以在别的节点上用beeline去连接

启动服务  bin/beeline

然后要连接他

!connect jdbc:hive2://hdp-01:10000

然后输入账户root  没有密码

课外知识  标准输出重定向。Linux里1就是标准输出

./linux脚本文件 1>/要输入的文件名 2>/错误时要定向到的文件名 &

这样就不会再终端打印了

/dev/null  是一个“黑洞”什么东西都会删除

上述启动,会将这个服务启动在前台,如果要启动在后台,则

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
基于hadoopHive数据仓库JavaAPI简单调用的实例,关于Hive的简介在此不赘述。hive提供了三种用户接口:CLI,JDBC/ODBC和 WebUI CLI,即Shell命令行 JDBC/ODBC 是 HiveJava,与使用传统数据库JDBC的方式类似 WebGUI是通过浏览器访问 Hive 本文主要介绍的就是第二种用户接口,直接进入正题。 1、Hive 安装: 1)hive安装请参考网上的相关文章,测试时只在hadoop一个节点上安装hive即可。 2)测试数据data文件'\t'分隔: 1 zhangsan 2 lisi 3 wangwu 3)将测试数据data上传到linux目录下,我放置在:/home/hadoop01/data 2、在使用 JDBC 开发 Hive 程序时, 必须首先开启 Hive 的远程服务接口。使用下面命令进行开启: Java代码 收藏代码 hive --service hiveserver >/dev/null 2>/dev/null & 我们可以通过CLI、Client、Web UI等Hive提供的用户接口来和Hive通信,但这三种方式最常用的是CLI;Client 是Hive的客户端,用户连接至 Hive Server。在启动 Client 模式的时候,需要指出Hive Server所在节点,并且在该节点启动 Hive Server。 WUI 是通过浏览器访问 Hive。今天我们来谈谈怎么通过HiveServer来操作Hive。   Hive提供了jdbc驱动,使得我们可以用Java代码来连接Hive并进行一些类关系型数据库的sql语句查询等操作。同关系型数据库一样,我们也需要将Hive的服务打开;在Hive 0.11.0版本之前,只有HiveServer服务可用,你得在程序操作Hive之前,必须在Hive安装的服务器上打开HiveServer服务,如下: 1 [wyp@localhost/home/q/hive-0.11.0]$ bin/hive --service hiveserver -p10002 2 Starting Hive Thrift Server 上面代表你已经成功的在端口为10002(默认的端口是10000)启动了hiveserver服务。这时候,你就可以通过Java代码来连接hiveserver,代码如下:
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值