- 博客(3)
- 收藏
- 关注
原创 Sqoop导入导出操作及参数配置
文章目录简介全量导入增量导入默认模式导出更新导出简介sqoop就是一个能够在 关系型数据库 和 hadoop 之间实现数据导入导出的工具,关系型数据库数据迁移到hadoop的称为导入,反之为导出。sqoop底层执行的是 mapreduce中的 mapTask,这是因为它实现数据的迁移,不涉及数据的聚合操作。在导入数据时,mapreduce 程序读取 数据库数据使用 DBinputFo...
2019-11-04 17:01:19 954
原创 Kudu启动过程中常见错误及解决方法
在kudu启动时,控制台显示启动ok并不一定已经真正启动了kudu-master和kudu-tserver,需要查看进程是否已经运行ps -ef | grep kudu[root@node01 ~]# ps -ef | grep kudukudu 9644 1 18 00:43 ? 00:00:02 /usr/lib/kudu/sbin/kudu-master ...
2019-10-30 00:47:07 5825
原创 Apache Impala学习笔记
Apache Impala:实时的sql查询工具1.Impala与Hive关系impla是个实时的sql查询工具,类似于hive的操作方式,只不过执行的效率极高,号称当下大数据生态圈中执行效率最高的sql类软件impala来自于cloudera,后来贡献给了apacheimpala工作底层执行依赖于hive 与hive共用一套元数据存储。在使用impala的时候,必须保证hive服务是...
2019-10-29 00:56:04 413
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人