Hive的使用以及如何利用echarts实现可视化在前端页面展示(三)---hive数据利用sqoop导出到mysql数据库里

1、安装sqoop

我的版本

jdk1.8

hadoop3.1.3

sqoop1.4.6

基本上就安装这个版本都没问题,如果是执行连接数据库命令时报错:java.lang.NoClassDefFoundError;报错,在lib下再放一个commons-lang-2.6.jar即可,

sqoop安装:Index of /dist/sqoop (apache.org)

commons-lang-2.6.jar下载:commons-lang-2.6.jar下载及Maven、Gradle引入代码,pom文件及包内class -时代Java (nowjava.com)

2、配置文件修改(改成你自己的)

cd $SQOOP_HOME/conf

mv sqoop-env-template.sh sqoop-env.sh

vi sqoop-env.sh

export HADOOP_COMMON_HOME= /export/servers/hadoop-3.1.3

export HADOOP_MAPRED_HOME= /export/servers/hadoop-3.1.3

export HIVE_HOME= /export/servers/hive

加入mysql的jdbc驱动包

 

cp /hive/lib/mysql-connector-java-5.1.32.jar $SQOOP_HOME

 

3、验证启动

bin/sqoop list-databases \
 --connect jdbc:mysql://localhost:3306/ \
 --username root --password hadoop

4、这里只使用导出到mysql

(建议有时间看看导入,当然我不是)

bin/sqoop export \
--connect jdbc:mysql://你的hadoop地址:3306/数据库名 \
--username 名称 \
--password 密码 \
--table 表名 \
--num-mappers 1 \
--export-表的url
--input-fields-terminated-by ","

关于查看url,可以使用

show create table

5、进入mysql查看是否导入

注意是虚拟机的mysql

6、可视化工具navicat建立连接

 

 连接成功就完成了,可以可视化看到数据

 

Hive的使用以及如何利用echarts实现可视化在前端页面展示(三)---hive数据利用sqoop导出到mysql数据库里

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
当下许多数据处理和分析的项目都会用到Hadoop, HDFS和Hive,以下是这些技术的概述: Hadoop: Hadoop是一个由Apache基金会所开发的开源分布式计算平台,可以处理大量数据。它的核心是一个分布式文件系统(HDFS)和一个分布式计算框架(MapReduce)。Hadoop可以运行在廉价的硬件上,通过多台计算机组成一个集群来处理大量的数据。 HDFS: HDFS是Hadoop分布式文件系统,用于存储和管理大数据集。它是一个基于Java的文件系统,可以支持超过数百个节点的集群。HDFS通过将大文件分成块(默认大小为128MB)并将这些块存储在不同的计算机节点上来实现高可靠性和高可扩展性。 Hive: Hive是一个基于Hadoop的数据仓库工具,允许用户通过SQL语言来查询和分析大数据集。它被设计成类似于关系型数据库,支持复杂查询,聚合和数据分析。Hive可以将SQL语句转换为MapReduce任务来处理数据ECharts: ECharts是一个基于JavaScript的开源可视化库,用于创建丰富的交互式数据可视化。它可以用于制作各种类型的图表,包括折线图、柱状图、饼图、散点图、地图等等。ECharts支持动态数据和响应式设计,在不同的设备上都能够很好的展示。 JavaWeb: JavaWeb是基于Java技术的Web开发框架,它包括Servlet、JSP、JavaBean、JDBC等技术。JavaWeb可以用于开发各种类型的Web应用程序,包括企业级应用程序。 Sqoop: Sqoop是一个用于在关系型数据库和Hadoop之间传输数据的工具。它可以将关系型数据库中的数据导入到Hadoop中,也可以将Hadoop中的数据导出到关系型数据库中。Sqoop支持MySQL、Oracle、PostgreSQL等主流数据库。 Flume: Flume是一个用于收集、聚合和移动大数据的分布式系统。它可以将数据从不同的数据源(如日志文件、消息队列、Web服务等)收集到Hadoop中进行处理和分析。Flume支持数据流的可靠性和容错性,可以在数据传输过程中保证数据的完整性。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值