1. 完成hadoop安装配置
- 以上已安装并配置完jdk、hadoop
- 也搭建了伪分布集群
2. 安装配置MySql
安装
下下一步初始化Hive元数据库时,遇到报错前一天两三小时没解决,问题定位在mysql,次日打算重装
配置
- 登录mysql
- 设置root远程连接
use mysql
select user, host from user;
update user set host="%" where user="root";
select user, host from user;
flush privileges;
create database metastore; # 准备下一步配置元数据到MySQL
exit
3. 安装Hive
- hive阿里云镜像:https://mirrors.aliyun.com/apache/hive/hive-3.1.2/apache-hive-3.1.2-bin.tar.gz
- 用wget 下载
wget https://mirrors.aliyun.com/apache/hive/hive-3.1.2/apache-hive-3.1.2-bin.tar.gz
- 我解压hive安装包至/opt/hive
tar -zxvf apache-hive-3.1.2-bin.tar.gz -C /opt/
mv /opt/apache-hive-3.1.2-bin /opt/hive
- 加上hive环境变量
echo 'export HIVE\_HOME=/opt/hive/' >> /etc/profile
echo 'export PATH=$PATH:$HIVE\_HOME/bin' >> /etc/profile
source /etc/profile
hive --version
- 初始化 Hive 的元数据存储结构
schematool -dbType derby -initSchema
先测试下,后面改完hive与mysql的相关配置后再-dbType mysql
4. 配置元数据到MySQL
- 拷贝JDBC
cp mysql-connector-java-5.1.49.jar $HIVE_HOME/lib
- 添加hive配置文件
vi $HIVE_HOME/conf/hive-site.xml
<!--指定Hive元数据存储的JDBC连接URL -->
<property>
<name>javax.jdo.option.ConnectionURL</name>
<value>jdbc:mysql://localhost:3306/metastore?useSSL=false</value>
</property>
<!--指定JDBC驱动程序的名称,mysql5这么写-->
<property>
<name>javax.jdo.option.ConnectionDriverName</name>
<value>com.mysql.jdbc.Driver</value>
</property>
<property>
<name>javax.jdo.option.ConnectionUserName</name>
<value>root</value>
</property>
<!--指定Hive数据仓库的默认位置-->
<property>
<name>hive.metastore.warehouse.dir</name>
<value>/user/hive/warehouse</value>
</property>
<!--指定连接MySQL数据库的密码-->
<property>
<name>javax.jdo.option.ConnectionPassword</name>
<value>sql密码</value>
</property>
- 采用MySQL存储元数据
schematool -dbType mysql -initSchema -verbose
这步真的遇到很多问题,就到处看帖子把和我报错信息一样的都拿来试试…实在不行就重装咯毕竟不懂什么底层逻辑…
- 使用hive
hive> show databases;
hive> show tables;
hive> create table stu(id int, name string);
hive> insert into stu values(1,"ss");
hive> select \* from stu;
5. hiveserver2服务
作用:开启用户模拟访问Hadoop集群数据
配置文件
配置访问hadoop的权限
vi $HADOOP_HOME/etc/hadoop/core-site.xml
<property>
<name>hadoop.proxyuser.root.hosts</name>
<value>\*</value>
</property>
**自我介绍一下,小编13年上海交大毕业,曾经在小公司待过,也去过华为、OPPO等大厂,18年进入阿里一直到现在。**
**深知大多数大数据工程师,想要提升技能,往往是自己摸索成长或者是报班学习,但对于培训机构动则几千的学费,着实压力不小。自己不成体系的自学效果低效又漫长,而且极易碰到天花板技术停滞不前!**
**因此收集整理了一份《2024年大数据全套学习资料》,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友。**
![img](https://img-blog.csdnimg.cn/img_convert/a11bc4fffaa4d768126a77dd8e771d1a.png)
![img](https://img-blog.csdnimg.cn/img_convert/d1a5542395ae7581a40782c74dc77c1e.png)
![img](https://img-blog.csdnimg.cn/img_convert/ffb6b2bb8cc67e6e44e9ee86e17304bd.png)
![img](https://img-blog.csdnimg.cn/img_convert/b24168787f8c5e03594a40c5fac11ef3.png)
![img](https://img-blog.csdnimg.cn/img_convert/95f1582b91855a58e55f7ea650c8ab56.png)
**既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,基本涵盖了95%以上大数据开发知识点,真正体系化!**
**由于文件比较大,这里只是将部分目录大纲截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频,并且后续会持续更新**
**如果你觉得这些内容对你有帮助,可以添加VX:vip204888 (备注大数据获取)**
![img](https://img-blog.csdnimg.cn/img_convert/e2b7766e482432d94428397ec41d4a99.png)
习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,基本涵盖了95%以上大数据开发知识点,真正体系化!**
**由于文件比较大,这里只是将部分目录大纲截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频,并且后续会持续更新**
**如果你觉得这些内容对你有帮助,可以添加VX:vip204888 (备注大数据获取)**
[外链图片转存中...(img-2XfB3wGs-1712886318774)]