clickhouse是什么?
- clickhouse是一个完全的列式分布式数据库管理系统(DBMS)
- clickhouse是一个用于联机分析(OLAP)的列式数据库管理系统,主要用于在线分析处理查询,能够使用SQL查询实时生成分析数据报告
OLAP是什么?
- OLAP是数据仓库系统的主要应用,支持复杂的分析操作,侧重决策支持,并且提供直观易懂的查询结果。
- OLAP采用多维报表和统计图形,查询提出以及数据输入直观灵活,用户可以方便的逐层细化,切块,切片,数据旋转
clickhouse的优点
- 灵活的MPP(大规模并行处理系统)架构,支持线性扩展,简单方便,高可靠性
- 多服务器分布式处理数据,完备的DBMS系统
- 底层数据列式存储,支持压缩,优化数据存储,优化索引数据
- 容错跑分快:比vertica快5倍,比hive快279倍,比MySQL快800倍,其可处理的数据级别已达到10亿级别
- 功能多:支持数据统计分析各种场景,支持类SQL查询,异地复制部署,海量数据存储,分布式运算,快速闪电的性能,几乎实时的数据分析,友好的SQL语法,出色的函数支持
clickhouse的缺点
- 不支持事务,不支持真正的删除/更新
- 不支持高开发
- 不支持二级索引
- 不擅长多表join
- 元数据管理需要人为干预
- 尽量做1000条以上的批量写入,避免逐行insert或小批量的insert,update,delete操作
clickhouse的核心概念
- 数据分片
- 列式存储
- 向量化(可理解成多线程,并发处理数据)
- 表
- 分区
- 副本
- 引擎(不同引擎决定了表数据存储特点,位置和表数据的操作行为)
clickhouse的使用
登录clickhouse
clickhouse-client --port 9500 -m --password *** //-m允许多行语句查询
报错
clickhouse-client -h linux01` 报错拒绝连接解决办法
1.看防火墙是否关闭
systemctl status firewalld
2.修改配置文件
vi conf.xml
<listen_host>::</listen_host>service clickhouse-server restart --重启服务
clickhouse-client -h linux01
查看日志信息
cd /var/log/clickhouse-server/
查看clickhouse存储位置
cd /data/clickhouse/data 这个就是clickhouse数据库存储的位置