ClickHouse的入门、使用和优化

本文介绍了ClickHouse,一个针对OLAP场景的列式数据库管理系统,特别适合大数据分析。文章详细讲解了ClickHouse的行存与列存概念,提供了安装教程,包括RPM安装和系统参数设置,并讨论了其引擎、建表参数和数据导入。此外,还总结了ClickHouse的优劣势以及使用优化策略,如数据类型选择、分区和索引设计、表参数调整等。
摘要由CSDN通过智能技术生成

ClickHouse是俄罗斯的重要网络服务门户之一Yandex所开源的一套针对数据仓库场景的多维数据存储与检索工具,一个用于联机分析(OLAP)的列式数据库管理系统(DBMS),它通过针对性的设计力图解决海量多维度数据的查询性能问题。

下面,enjoy:

一、数据库的行存与列存

在传统的行式数据库系统中,数据按顺序存储:
处于同一行中的数据总是被物理的存储在一起,常见的行式数据库系统有:MySQL、Postgres和MS SQL Server。
在这里插入图片描述

在列式数据库系统中,来自不同列的值被单独存储,来自同一列的数据被存储在一起。列式数据库更适合于OLAP场景(对于大多数查询而言,处理速度至少提高了100倍)。新兴的 Hbase、HP Vertica、EMC Greenplum 等分布式数据库均采用列式存储。
在这里插入图片描述

ClickHouse采取的就是列示存储的方式。

二、ClickHouse安装及常用命令参数

1.ClickHouse支持的操作系统和硬件环境

只要是Linux,64位都可以。优先支持Ubuntu,Ubuntu有官方编译好的安装包可以使用。其次是CentOS和RedHat,有第三方组织编译好的rpm包可以使用。

如果是其他Linux系统,需要自己编译源码。

而且,机器的CPU必须支持SSE 4.2指令集。

[root@localhost ~]# grep -q sse4_2 /proc/cpuinfo && echo “SSE 4.2 supported” || echo “SSE 4.2 not supported”

2.ClickHouse的安装方法

(1)RPM安装包

推荐使用CentOS、RedHat和所有其他基于rpm的Linux发行版的官方预编译rpm包。

首先,您需要添加官方存储库:

sudo yum install yum-utils

sudo rpm --import https://repo.clickhouse.tech/CLICKHOUSE-KEY.GPG

sudo yum-config-manager --add-repo https://repo.clickhouse.tech/rpm/stable/x86_64

然后运行命令安装:

sudo yum install clickhouse-server clickhouse-client

(2)设置系统参数

CentOS取消打开文件数限制

在/etc/security/limits.conf、/etc/security/limits.d/90-nproc.conf这2个文件的末尾加入以下内容:

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值