Hive是基于Hadoop的数据仓库工具,可对存储在HDFS上的文件中的数据集进行数据整理、特殊查询和分析处理,提供了类似于SQL语言的查询语言–HiveQL,可通过HQL语句实现简单的MR统计,Hive将HQL语句转换成MR任务进行执行。
睿思BI作为一种数据可视化分析工具,支持从Hive表中导入数据到BI系统中,实现大数据分析结果的可视化展现。
1.点击系统菜单数据导入 - 数据库导入菜单,系统进入从数据库导入数据页面,如下图:
2.选择数据库类型为Hive,录入IP地址,端口号,数据库名称,账号密码等信息,点击测试链接按钮。请注意Hive必须先启动JDBC链接服务端,命令为:
$HIVE_HOME/bin/hive --service hiveserver2 &
3.测试连接成功后,点击下一步,进入数据导入页面,如下图:
4.录入SQL语句,选择目标表表,如果没有目标表,可以直接新建表,配置完成后即可进行数据导入。操作过程和从MySql导入数据一样。