使用Sqoop将HDFS中数据导入MYSQL中

最新推荐文章于 2021-11-28 21:06:39 发布

超速前行

最新推荐文章于 2021-11-28 21:06:39 发布

阅读量1.9k

点赞数

分类专栏： Hadoop 文章标签： hadoop hdfs sqoop export

Hadoop 专栏收录该内容

8 篇文章 0 订阅

订阅专栏

使用Sqoop将HDFS中数据导入MYSQL中

Sqoop是Apache项目，是Hadoop生态系统的扩展出来的。在某些方面Sqoop类似于distcp工具。两者都建立在MapReduce的基础之上，并且利用并行和容错。然而，Sqoop与Distcp的主要区别是：Sqoop主要被设计用来使得关系型数据库和HDFS之间进行数据的导入与导出（通过JDBC）。

它的功能广泛。这一节将讲述使用Sqoop将weblog数据从HDFS导出到MySql中。

准备工作

安装Sqoop。

安装MySQL，并确保他与Hadoop集群之间的联通性。

将MySQL JDBC driver JAR包拷贝到 $SQOOP_HOME/libs目录下。

操作步骤

1、如果数据库不存在，创建数据库

CREATE DATABASE logs;

2、创建数据表

USE logs;
CREATE TABLE weblogs_from_hdfs (
md5 VARCHAR(32),
url VARCHAR(64),
request_date DATE,
request_time TIME,
ip VARCHAR(15)
);

3、将数据从HDFS导出到MySQl数据库中

sqoop export -m 1 --connect jdbc:mysql://192.168.11.131:3306/logs --username root --password 308308 --table weblogs_from_hdfs --export-dir hdfs://192.168.11.131:9000/data/weblogs/weblog_entries.txt --input-fields-terminated-by '\t'

补充

--table参数指定的是从HDFS中接收数据的表，因此这个表必须在运行Sqoop export之前创建。Sqoop使用数据表的元数据包括列和类型验证来自HDFS的数据，创建insert指令。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

超速前行 CSDN认证博客专家 CSDN认证企业博客

码龄12年

22: 原创

18万+: 周排名

143万+: 总排名

28万+: 访问

: 等级

2385: 积分

42: 粉丝

70: 获赞

16: 评论

242: 收藏

私信

关注

热门文章

分类专栏

SLAM 3篇
Hadoop 8篇
Gradle 1篇
并发多线程 7篇
Hadoop2.3.0
Pig 1篇
hive 2篇
Spring AMQP 11篇
Scala 1篇
OpenCv 3篇
Netty In Action 8篇
教育 1篇
前端 2篇
Spring JMS
J2ee 1篇
配置管理 1篇
开源gis 1篇
C++ 13篇
gis 1篇
Visual Odometry 1篇

最新评论

Eigen Matrix 详解
野生蘑菇菌: m << 1, 2, 3, 4, 5, 6, 7, 8, 9; 博主，这里少了分号。
Eigen Matrix 详解
Neek_hua: 可以的，在我看来，取负意味着被取负的那个参数是动态的意思
Eigen Matrix 详解
Kingsleyandher: 你好，想请问您一个问题！就是Matrix参数里面可以取负数嘛？像下面这个样子的 Eigen::Matrix<float, -1, 2, Eigen::RowMajor>
c\c++中比较两个字符串或string对象是否相等
WmxL56: 但是有的人说， == 就是重载了compare这个函数，实际使用效果是一样的
Eigen Matrix 详解
小可story: 感谢

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。