clickhouse中sql操作
注意事项:
1、clickhouse中sql语句是使用单引号'',如果使用双引号会报错,这个跟mysql有区别
2、在clickhouse中使用group by 时 group by 字段 必须在select 中要有 否则会出现错误
3、使用 DISTINCT进行去重后不能使用count来进行统计
4、创建表的时候尽量不要使用Nullable 虽然当时不会有问题 后面如果想对字段进行一些处理会有错误
5、clickhouse中尽量不要使用uuid 会让整张表特别的大
6、创建表时 字段int类型 这里的Int首字母I必须大写 否则会报错
7、创建表时尽量不要使用空字符串来进行填充 可以使用像-1这样的数据进行填充
8、注意创建表时使用的引擎,ENGINE = MergeTree 不同的引擎具体有啥不同还没有研究
9、clickhouse中图形化工具对数据增删改不是很友好
10、在clickhouse 关联查询中 ON后面不能使用模糊查询 也不要去尝试模糊查询迪卡尔会搞死你的
例子:
创建数据表
CREATE TABLE test.ecc_metadata
(
`id` UUID DEFAULT generateUUIDv4(),
`order_number` String DEFAULT '-1' COMMENT '订单号',
`item` Float64 DEFAULT '-1' COMMENT '数量',
`plant` Int64 DEFAULT '-1' COMMENT 'xxx字段',
`partition_fields` Date COMMENT '日期2021-01-01'
--这个会自动获取系统当前时间2021-01-01 00:00:00
`create_date` DateTime DEFAULT now()
)
ENGINE = MergeTree
ORDER BY order_number
SETTINGS index_granularity = 8192
复制表结构
CREATE TABLE 新的表名 LIKE 要复制表结构的表名;
查看表结构
SHOW CREATE TABLE 表名
增
将数据插入到另外一张表中
INSERT INTO 要插入的表 SELECT * from 原始数据表;
当我们要往一张表中插入新的数据的时候 例如:表中的id是自增的我们不需要插入、时间是获取的双系统时间也不需要进行插入 我们在insert into 表名 后面把其余不能自动生成的字段加上
INSERT INTO 要插入数据的表名
SELECT DISTINCT
字段1,字段2,字段3,
from 查询的表名
查看占用空间大小
SELECT
sum(rows) as totalRows,--总行数
formatReadableSize(sum(data_uncompressed_bytes)) as data_uncompressed,--原始大小
formatReadableSize(sum(data_compressed_bytes)) as data_compressed,--压缩大小
round(sum(data_compressed_bytes) / sum(data_uncompressed_bytes) * 100, 0) as data_compressed_rate--压缩率
from system.parts
where database ='数据库' AND table ='表名'
复杂查询
1、例如单表中我们需要查询年级相同、班级相同、年龄不同的
SELECT t0.*
FROM
(SELECT * from 表名 WHERE 条件
) as t0
LEFT JOIN
(SELECT 字段名 from 表名 WHERE 条件
) as t1 ON
t0.班级= t1.班级 AND t0.年级= t1.年级
WHERE t0.年龄!= t1.年龄
导出数据 到指定目录下面
SELECT * FROM 表名 WHERE 条件 INTO OUTFILE '/路径/test.txt';
可以是txt 也可以是csv 也可以是xls
如果要做筛选啥的还是xls格式好用 直接就是excel可以打开
修改字段名称
ALTER TABLE 表名 RENAME COLUMN 原始字段名TO 修改后的名字
修改字段数据类型
ALTER TABLE 表名 modify column 字段名 Nullable(String); 后面是要修改的数据类型
删除数据
ALTER TABLE 数据库名.表名DELETE WHERE 条件
函数
if语句 判断是否为空 为空 返回 y 不为空 返回n
if(empty(''),'y','n')
字符串切割 前提不能是Nullable类型 否则会报错
select splitByChar('/', '2017/01/02')[1] AS src
获取字符串长度
select LENGTH(splitByChar('/', '2017/1/02')[2]) as f
字符串拼接
select concat('0',splitByChar('/', '2017/1/02')[2]) as f
判断是否为空
IFNULL(字段名,-1)
case when 语法
CASE WHEN 条件 THEN 满足添加的时候 else 不满足添加的时候 END
clickhouse python
最新推荐文章于 2024-06-21 16:49:30 发布