![](https://img-blog.csdnimg.cn/20190927151026427.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
ClickHouse
文章平均质量分 75
ClickGouse安装相关基础
大数据开发工程师-宋权
攻城狮,嗷!!!!
展开
-
(09)分片集群
副本虽然能够提高数据的可用性,降低丢失风险,但是每台服务器实际上必须容纳全量 数据,对数据的横向扩容没有解决要解决数据水平切分的问题,需要引入分片的概念。通过分片把一份完整的数据进行切 分,不同的分片分布到不同的节点上,再通过 Distributed 表引擎把数据拼接起来一同使用。 Distributed 表引擎本身不存储数据,有点类似于 MyCat 之于 MySql,成为一种中间 件,通过分布式逻辑表来写入、分发、路由来操作多台节点不同分片的分布式数据。 注意:ClickHous原创 2021-08-03 10:11:13 · 133 阅读 · 0 评论 -
(08)副本
副本的目的主要是保障数据的高可用性,即使一台 ClickHouse 节点宕机,那么也可以 从其他服务器获得相同的数据。6.1 副本写入流程6.2 配置步骤 ➢ 启动 zookeeper 集群 ➢ 在hadoop202的/etc/clickhouse-server/config.d目录下创建一个名为metrika.xml 的配置文件,内容如下:➢ 同步到 hadoop203 和 hadoop204 上 sudo /home/atguig..原创 2021-08-03 09:51:06 · 112 阅读 · 0 评论 -
(07)SQL 操作
基本上来说传统关系型数据库(以 MySQL 为例)的 SQL 语句,ClickHouse 基本都支 持,这里不会从头讲解 SQL 语法只介绍 ClickHouse 与标准 SQL(MySQL)不一致的地方。5.1 Insert 基本与标准 SQL(MySQL)基本一致 ➢ 标准 insert into [table_name] values(…),(….) ➢ 从表到表的插入 insert into [table_name] select a,b,c from [tab原创 2021-07-30 15:26:49 · 155 阅读 · 0 评论 -
(06)SummingMergeTree
对于不查询明细,只关心以维度进行汇总聚合结果的场景。如果只使用普通的 MergeTree 的话,无论是存储空间的开销,还是查询时临时聚合的开销都比较大。 ClickHouse 为了这种场景,提供了一种能够“预聚合”的引擎 SummingMergeTree➢ 案例演示 ◼ 创建表◼ 插入数据 ◼ 执行第一次查询 hadoop202 :) select * from t_order_smt;◼ 手动合并 OPTIMIZE TABL...原创 2021-07-30 15:15:14 · 396 阅读 · 0 评论 -
(05) primary key 主键(可选)
ClickHouse 中的主键,和其他数据库不太一样,它只提供了数据的一级索引,但是却 不是唯一约束。这就意味着是可以存在相同 primary key 的数据的。 主键的设定主要依据是查询语句中的 where 条件根据条件通过对主键进行某种形式的二分查找,能够定位到对应的 index granularity, 避免了全表扫描。 index granularity: 直接翻译的话就是索引粒度,指在稀疏索引中两个相邻索引对 应数据的间隔。ClickHouse 中的 MergeTre原创 2021-07-30 15:06:49 · 317 阅读 · 0 评论 -
(04)表引擎
4.1 表引擎的使用表引擎是 ClickHouse 的一大特色。可以说, 表引擎决定了如何存储标的数据。包括: ➢ 数据的存储方式和位置,写到哪里以及从哪里读取数据 ➢ 支持哪些查询以及如何支持。 ➢ 并发数据访问。 ➢ 索引的使用(如果存在)。 ➢ 是否可以执行多线程请求。 ➢ 数据复制参数。 表引擎的使用方式就是必须显式在创建表时定义该表使用的引擎,以及引擎使用的相关参数。 特别注意:引擎的名称大小写敏感4.2 TinyLog原创 2021-07-30 14:48:55 · 287 阅读 · 0 评论 -
(03)数据类型
3.1 整型 固定长度的整型,包括有符号整型或无符号整型。 整型范围(-2n-1~2n-1-1):Int8 - [-128 : 127] Int16 - [-32768 : 32767] Int32 - [-2147483648 : 2147483647] Int64 - [-9223372036854775808 : 9223372036854775807] 无符号整型范围(0~2n-1): UInt8 - [0 : 255] UInt16 - [0 : 65535]原创 2021-07-30 14:31:11 · 93 阅读 · 0 评论 -
(2)ClickHouse 的安装
2.1 准备工作 2.1.1 确定防火墙处于关闭状态 2.1.2 CentOS 取消打开文件数限制 ➢ 在 hadoop202 的 /etc/security/limits.conf 文件的末尾加入以下内容➢ 在 hadoop202 的/etc/security/limits.d/20-nproc.conf 文件的末尾加入以下内容➢ 执行同步操作2.1.3 安装依赖 [atguigu@hadoop204 ~]$ sudo yum install -y libto...原创 2021-07-30 14:25:27 · 109 阅读 · 0 评论 -
(1)第1章 ClickHouse 入门
ClickHouse 是俄罗斯的 Yandex 于 2016 年开源的列式存储数据库(DBMS),使用 C++语言编写,主要用于在线分析处理查询(OLAP),能够使用 SQL 查询实时生成分析 数据报告。 1.1 ClickHouse 的特点 1.1.1 列式存储 以下面的表为例:好处是想查某个人所有的属性时,可以通过一次磁盘查找加顺序读取就可以。但是当想查所 有人的年龄时,需要不停的查找,或者全表扫描才行,遍历的很多数据都是不需要的。➢ 采用列式存储时.原创 2021-07-30 14:12:39 · 112 阅读 · 0 评论