Clickhouse (一)

最新推荐文章于 2024-05-20 17:49:30 发布

Fatel_

最新推荐文章于 2024-05-20 17:49:30 发布

阅读量125

收藏

点赞数

文章标签： clickhouse 数据库

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Fatel_/article/details/132864011

版权

一. Clickhouse简介

Clickhouse 是开源的列式存储数据库 (DBMS) 源码是使用 C++语言编写主要用于在线分析处理查询能使用SQL查询实时生成分析数据报告 (分析型数据库特点就是方便增删查改)

二.Clickhouse特点

1 . 列式存储 (Hbase 也是列式存储)

列式存储的好处:

( 1.对于列的聚合,计数,求和等统计操作原因优于行式存储

2.由于每一列的数据类型都是相同的,针对数据存储更容易进行数据压缩

3.由于数据压缩比更好,所以相对了节省了磁盘空间,对于缓存(cache)也有更好的发挥空间)

2.DBMS的功能

是运用sql语法,包括了DDL 建表语句字段名和DML 查询语句以及配套的各种函数 (count sum ),用户管理及权限管理,数据的备份和恢复

3.多样化引擎

Clickhouse 和MySQL (innodb:提供了事务 mariadb :没有事务)类似,把表级的存储引擎插件化合并树,日志,接口和其他四大类的20种引擎最常用的是合并树 (Merge Tree 这是一个家族里面有很多引擎)

4.高吞吐的写入能力

Clickhouse 采用类 LSM Tree (hbase 也是这个写入的时候先写入到缓存然后进行合并(定期合并) 然后才会进行缓存上的数据操作根据时间戳只有合并的时候才会把老数据真正的删除替代掉)的结构顺序追加写 (kafka 高效是因为它是顺序写对比随机写高 6000倍) 写入后数据不可更改然后进行规定排序写入到磁盘所以总结 1 采用了LSM Tree 这个结构 2 定期合并 3 顺序写

5.数据分区与线程级并行

数据分区(之前在 hive 的时候也有学习分区的主要目的是为了避免全表搜索从而提升搜索效率)

线程级 (单条的查询就能利用本机所有的CPU 所有它才快所有也导致了它的缺陷多数查询的时候就会变慢所有高 qps不是它的强项) 后续使用的时候这一点会导致一些问题也就是在一些情况下会不好使用费CPU 所以它不适合做初始的储存适合做后期已经处理过的大量的字段多的宽表查询

6.性能对比

单表查询的情况下 Clickhouse 是最具有优势的选择

关联查询的情况下在设计到join的情况下虐式就比较明显了

两张表查询的时候它会把右表存到缓存然后跟左表挨个对比这也是导致它慢的原因

虚拟机操作:

ulimit -a

Open files 表示打开的文件数

Max user processes 进程数

用ES 调整这两个数值

值

从上往下一次为:

"*" 所有的用户所有的组给单个用户

Soft 软状态当前生效的

Hard 硬状态最大生效的 (上限)

在设置的时候软的要小于或等于硬的

还有一个 -配值表示软硬一起配

nofile 用户能打开的文件数 65536最大数

Nproc 打开文件数用户能打开的进程数 131072最大数

设置完后需要重新登录就会生效 (所有的虚拟机都要配)

安全系统查看和临时关闭

0 是开启 1 是关闭

版本差异:

服务端的配置 (集群的配置): config

参数配置(cpu,最大内存使用): users

数据路径 (可以修改存储数据的路径但是不推荐修改)

日志存储路径上面是进程日志下面是报错的日志

更改完配置后需要刷新重启 :sudo clickhouse restart

因为之前设置了密码所以在使用的时候后面需要加上--password 然后回车输入密码

然后我们就可以正常的进行各种SQL操作

Fatel_

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

Fatel_ CSDN认证博客专家 CSDN认证企业博客

码龄1年

暂无认证

12: 原创

67万+: 周排名

181万+: 总排名

1349: 访问

: 等级

121: 积分

0: 粉丝

1: 获赞

10: 评论

1: 收藏

私信

关注

热门文章

最新评论

Clickhouse (四)
CSDN-Ada助手: 恭喜你写了第12篇博客！看到你对Clickhouse的持续探索和分享，我十分欣喜。你的文章总是能够为读者提供深入的见解和有用的信息。希望你能继续保持创作的热情，继续分享你在Clickhouse方面的见解和经验。或许你可以考虑探讨一些Clickhouse在大数据分析中的应用案例，或是深入剖析Clickhouse的性能优化方法。期待你的下一篇博客！
Clickhouse (三 TTL数据)
CSDN-Ada助手: 恭喜您第11篇博客的问世！标题“Clickhouse (三 TTL数据)”引起了我的兴趣。我很高兴看到您对于这个主题的深入研究，并将其分享给读者。您的博客内容一定会对那些对Clickhouse以及TTL数据感兴趣的读者们有所帮助。在下一篇博客中，或许您可以考虑进一步探索Clickhouse中TTL数据的应用场景，或者提供一些实际案例，这样读者们能更好地理解如何在实际项目中应用这些概念。当然，这只是一个谦虚的建议，我相信您一定会继续以您独特的方式创作出更多优质的内容。期待不久后能够阅读到您的下一篇博客！
Spark (理论篇)
CSDN-Ada助手: 恭喜您撰写了第8篇博客《Spark (理论篇)》！阅读您的博客让我对Spark有了更深刻的理解。您的文章结构清晰，讲解详尽，使得复杂的理论概念也变得易于理解。我期待您未来更多的创作。或许在下一篇博客中，您可以探索一些Spark实践案例，结合理论知识给出具体应用的示例，这样读者能更好地将理论知识转化为实践经验。再次感谢您的分享，期待您的下一篇博文！
Clickhouse (一)
CSDN-Ada助手: 恭喜您写了第7篇博客！标题为“Clickhouse (一)”，内容看起来非常有趣。我很高兴看到您持续创作，并分享有关Clickhouse的知识。希望您能继续坚持下去，为我们带来更多关于Clickhouse或其他相关话题的深入探讨。也许您可以考虑在接下来的博客中，分享一些Clickhouse的实际应用案例或者与其他数据存储方案的对比，这样读者们能更好地了解其在实践中的价值。期待您的下一篇博客！
SparkSQL(三)(案例)
CSDN-Ada助手: 恭喜您写完了第6篇博客！标题“SparkSQL(三)(案例)”听起来非常吸引人。您的持续创作精神令人钦佩。在该博客中，您似乎探讨了SparkSQL的案例应用。这样的实际案例对读者来说非常有价值，帮助我们更好地理解和应用SparkSQL。接下来，我想提供一些建议供您参考。您可以考虑在下一篇博客中深入探讨一些高级的SparkSQL特性，或者分享一些使用SparkSQL解决复杂问题的实际经验。另外，您也可以考虑与读者互动，邀请他们分享自己在SparkSQL方面的挑战和解决方案。这样一来，您的博客将更具互动性，读者也能从中获得更多的启发和帮助。非常期待您下一篇博客的发布！请继续保持创作的热情和努力，我相信您会取得更大的成就。谢谢您的分享！

最新文章

2023年12篇

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。

余额充值