ck
文章平均质量分 53
冲冲冲 干就完了!
记录一下日常的错误,以及记录一些比较nb的技术。
展开
-
clickhose中如何处理自增一列
解决办法ck中有个rowNumberInAllBlocks()函数,作用是返回此函数处理的所有块内的递增行号。所以我们可以这样写:select rowNumberInAllBlocks(),* from test.test limit 100但是返回的下标是从0开始,如果你想从1开始,你就加个1就完了select rowNumberInAllBlocks() + 1,* from test.test limit 100...原创 2021-12-19 16:13:03 · 1885 阅读 · 0 评论 -
BitMap理解
正常来说,bitmap就是以很小的内存存储操作一些庞大的数据量,比如4个亿的数据,假如存在int里 4*32*1亿,再除以1024的三次方,约等于10个g,得占用大概11个g的内存。有的电脑已经存不下了。所以bitmap出现了,他以bit为一个单位进行存储,比int小32倍,这样3000MB就可以存储。bitmap的算法理解,推荐看这个链接:漫画:什么是Bitmap算法?_bitmap这个比较通俗易懂。压缩算法的博客推荐:不用找了,roaringBitMap原理看这个就行了 ...原创 2021-09-23 18:10:49 · 412 阅读 · 0 评论 -
ClickHouse实战语法笔记
bitmap的语法记录:groupBitmapOrState()去除重复 bitmapAndnot(a,b) 除去a中a和b的交集。 bitmapCardinality() 返回bitmap的数量 bitmapAnd(a,b) a和b的交集正常的语法:array join 把一个集合拆开,用法 select a from (select ( ['1','2','3','4','1','5']) as a) array join a 输出: groupArray() 上个方法的反过来。..原创 2021-09-22 18:57:36 · 399 阅读 · 0 评论 -
ClickHouse表引擎
ClickHouse表引擎概览下图是ClickHouse提供的所有表引擎汇总。一共分为四个系列,分别是Log、MergeTree、Integration、Special。详细文章请看ClickHouse表引擎到底怎么选_A1373712651的博客-CSDN博客_clickhouse引擎选用;...转载 2021-09-22 11:31:21 · 111 阅读 · 0 评论 -
ClickHouse分区分片的简单理解
最近项目用到clickhouse,打算具体学习一下,听领导说和mysql很相似,但是要比mysql更复杂一点,昨天转载了基本类型,今天打算记录一下CK的分区分片。在网上搜索到的:分区是表的分区,具体的DDL操作关键词是 PARTITION BY,指的是一个表按照某一列数据(比如日期)进行分区,对应到最终的结果就是不同分区的数据会写入不同的文件中。分片复用了数据库的分区,相当于在原有的分区下,作为第二层分区, 是在不同节点/机器上的体现。具体关系如下:出自对ClickHouse..原创 2021-09-18 09:38:44 · 2749 阅读 · 0 评论