apache配置支持mysql_Apache Kylin | 建立 JDBC 数据源

Apache Kylin自v2.3.0开始支持JDBC数据源,如MySQL、SQL Server和Redshift。配置包括安装Sqoop,放置JDBC驱动,修改kylin.properties文件,设置连接URL、驱动、用户和密码等。完成配置后,重启Kylin即可从JDBC数据源加载表,并设计模型和Cube。
摘要由CSDN通过智能技术生成

自 Apache Kylin v2.3.x 起有效

支持 JDBC 数据源

自 v2.3.0 Apache Kylin 开始支持 JDBC 作为第三种数据源(继 Hive,Kafka)。用户可以直接集成 Kylin 和他们的 SQL 数据库或数据仓库如 MySQL,Microsoft SQL Server 和 HP Vertica。其他相关的数据库也很容易支持。

配置 JDBC 数据源

准备 Sqoop

Kylin 使用 Apache Sqoop 从关系型数据库加载数据到 HDFS。在与 Kylin 同一个机器上下载并安装最新版本的 Sqoop。我们使用 SQOOP_HOME 环境变量指出在本指南中 Sqoop 的安装路径。

准备 JDBC driver

需要下载您数据库的 JDBC Driver 到 Kylin server。JDBC driver jar 需要被加到 $KYLIN_HOME/ext 和 $SQOOP_HOME/lib 文件夹下。

配置 Kylin

在 $KYLIN_HOME/conf/kylin.properties 中,添加以下配置。

MySQL 样例:

kylin.source.default=8

kylin.source.jdbc.connection-url=jdbc:mysql://hostname:3306/employees

kylin.source.jdbc.driver=com.mysql.jdbc.Driver

kylin.source.jdbc.dialect=mysql

kylin.source.jdbc.user=your_username

kylin.source.jdbc.pass=your_password

kylin.source.jdbc.sqoop-home=/usr/hdp/current/sqoop-client/bin

kylin.source.jdbc.filed-delimiter=|

SQL Server 样例:

kylin.source.default=8

kylin.source.jdbc.connection-url=jdbc:sqlserver://hostname:1433;database=sample

kylin.source.jdbc.driver=com.microsoft.sqlserver.jdbc.SQLServerDriver

kylin.source.jdbc.dialect=mssql

kylin.source.jdbc.user=your_username

kylin.source.jdbc.pass=your_password

kylin.source.jdbc.sqoop-home=/usr/hdp/current/sqoop-client/bin

kylin.source.jdbc.filed-delimiter=|

Amazon Redshift 样例:

kylin.source.default=8

kylin.source.jdbc.connection-url=jdbc:redshift://hostname:5439/sample

kylin.source.jdbc.driver=com.amazon.redshift.jdbc.Driver

kylin.source.jdbc.dialect=default

kylin.source.jdbc.user=user

kylin.source.jdbc.pass=pass

kylin.source.jdbc.sqoop-home=/usr/hdp/current/sqoop-client/bin

kylin.source.default=8

kylin.source.jdbc.filed-delimiter=|

这里有另一个参数指定应该分为多少个切片。Sqoop 将为每一个切片运行一个 mapper。

kylin.source.jdbc.sqoop-mapper-num=4

为了使每个 mapper 都能够输入,分割列按以下规则进行选择:

* ShardBy 列,如果存在;

* Partition date 列,如果存在;

* High cardinality 列,如果存在;

* Numeric 列,如果存在;

* 随便选一个。

请注意,当在 conf/kylin.properties 中配置这些参数时,您所有的 projects 使用 JDBC 作为数据源。

从 JDBC 数据源加载表

重启 Kylin 让改变生效。您现在可以从 JDBC 数据源加载表。访问 Kylin web 然后导航到数据源面板。

点击 Load table 按钮然后输入表名,或点击 “Load Table From Tree” 按钮然后选择要加载的表。不检查 Calculate column cardinality 因为对于 JDBC 数据源这个功能并不支持。

点击 “Sync”,Kylin 通过 JDBC 接口加载表定义。当表加载成功后您可以查看表和列,和 Hive 相似。

load_table_03.png

继续向前设计您的 model 和 Cube。当 building Cube 时,Kylin 将会使用 Sqoop 从 HDFS 中引入数据,然后在其上运行 building。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值