获取原文
简短介绍
大家好,又迎来了一天的喘息(休息)时间。可有想发生点什么吗?行,我们今天就发生点什么吧。看看大数据中的另一款神器,数据传输工具Sqoop。它是我接触比较早的组件。个人非常喜欢它。为什么喜欢它呢?因为它够快,够简单,够方便。目前我们平台对Sqoop进行了一些上层封装,在界面点选几下,即可完成一批表的数据同步。听着是不是很赞呢?先还是介绍下Sqoop吧。
01-Sqoop介绍
Sqoop是Apache开源的一款工具,主要是针对关系型数据库与Hadoop集群之间的数据传输。它可以将关系型数据库中的数据导入至Hadoop集群中(即:导入至Hdfs)。也可以将Hadoop集群(HDFS)中数据导出至关系型数据库中。Sqoop就是一款ETL工具,它具有高效和大批量数据传输的特性。同时原生Sqoop都是采用指令形式提交和触发任务。小伙伴们是不是有淡淡的忧伤,又是指令的方式操作。所以学好指令也很重要哦。
sqoop功能流程图
02-Sqoop功能介绍
sqoop本身也包含一系列的功能