阿里云 E-MapReduce(简称EMR)是运行在阿里云平台上的一种大数据处理的系统解决方案。
ClickHouse 作为开源的列式存储数据库,主要用于在线分析处理查询(OLAP),能够使用 SQL 查询实时生成分析数据报告。而阿里云 EMR ClickHouse 则提供了开源 OLAP 分析引擎 ClickHouse 的云上托管服务。
本系列文章将从以下几个方面详细介绍 EMR ClickHouse 的操作指南:
快速入门 (本文)
ClickHouse 运维
数据导入
常见问题
EMR ClickHouse 操作指南 — 快速入门
一、创建集群:
创建 ClickHouse 集群的详细操作步骤和相关配置。
前提条件
已在目标地域创建一个专有网络和交换机,详情请参见使用专有网络和使用交换机。
使用专有网络:
https://help.aliyun.com/document_detail/65398.htm
使用交换机:
https://help.aliyun.com/document_detail/65387.htm
背景信息
机型、内存和磁盘的设置,请参见
Usage Recommendations:
https://clickhouse.tech/docs/en/operations/tips
操作步骤
1、进入创建集群页面。
a、登录 阿里云E-MapReduce控制台。
EMR 控制台:https://emr.console.aliyun.com
b、在顶部菜单栏处,根据实际情况选择地域和资源组。
地域:创建的集群将会在对应的地域内,一旦创建不能修改。
资源组:默认显示账号全部资源。
c、单击创建集群,进行创建。
2、配置集群信息。
创建集群时,您需要对集群进行软件配置、硬件配置和基础配置。
#注意 #
集群创建完成后,除了集群名称以外,其他配置均无法修改,所以在创建时请仔细确认各项配置。
软件配置
配置项 | 说明 |
集群类型 | 选择 ClickHouse。 |
产品版本 | 默认最新的软件版本。 |
必选服务 | 默认的服务组件,后期可以在管理页面中启停服务。 |
可选服务 | 根据您的实际需求选择其他的一些组件,被选中的组件会默认启动相关的服务进程。 说明: 组件越多,对机器的配置要求也越高,所以在下面的步骤中您需要根据实际的组件数量进行机器选型,否则可能没有足够的资源运行这些服务。 |
高级设置 | 软件自定义配置:可指定 JSON 文件对集群中的基础软件(例如Hadoop、 |
硬件配置
区域 | 配置项 | 说明 |
付费类型 | 付费类型 | 默认包年包月。当前支持的付费类型如下: 按量付费:一种后付费模式,即先使用再付费。按量付费是根据实际使用的小时数来支付费用,每小时计费一次,适合短期的测试任务或是灵活的动态任务。 包年包月:一种预付费模式,即先付费再使用。 说明:建议测试场景下使用按量付费,测试正常后再新建一个包年包月的生产集群正式使用。 |
网络配置 | 可用区 | 可用区为在同一地域下的不同物理区域,可用区之间内网互通。通常使用默认的可用区即可。 |
网络类型 | 默认专有网络。 | |
VPC | 选择在该地域的VPC。如果没有可用的VPC,单击创建VPC/子网 |