clickhouse python

clickhouse中sql操作
注意事项:
1、clickhouse中sql语句是使用单引号'',如果使用双引号会报错,这个跟mysql有区别
2、在clickhouse中使用group by 时 group by 字段 必须在select 中要有 否则会出现错误
3、使用 DISTINCT进行去重后不能使用count来进行统计
4、创建表的时候尽量不要使用Nullable 虽然当时不会有问题 后面如果想对字段进行一些处理会有错误
5、clickhouse中尽量不要使用uuid  会让整张表特别的大
6、创建表时 字段int类型 这里的Int首字母I必须大写 否则会报错
7、创建表时尽量不要使用空字符串来进行填充  可以使用像-1这样的数据进行填充
8、注意创建表时使用的引擎,ENGINE = MergeTree 不同的引擎具体有啥不同还没有研究
9、clickhouse中图形化工具对数据增删改不是很友好
10、在clickhouse 关联查询中 ON后面不能使用模糊查询  也不要去尝试模糊查询迪卡尔会搞死你的

例子:
创建数据表
CREATE TABLE test.ecc_metadata
(
    `id` UUID DEFAULT generateUUIDv4(),
    `order_number` String DEFAULT '-1' COMMENT '订单号',
    `item` Float64 DEFAULT '-1' COMMENT '数量',
    `plant` Int64 DEFAULT '-1' COMMENT 'xxx字段',
    `partition_fields` Date COMMENT '日期2021-01-01'
    --这个会自动获取系统当前时间2021-01-01 00:00:00
    `create_date` DateTime DEFAULT now()
)
ENGINE = MergeTree
ORDER BY order_number
SETTINGS index_granularity = 8192


复制表结构
CREATE TABLE 新的表名  LIKE 要复制表结构的表名;              

查看表结构
SHOW CREATE TABLE 表名   

增
将数据插入到另外一张表中
INSERT INTO 要插入的表 SELECT * from 原始数据表;              

当我们要往一张表中插入新的数据的时候 例如:表中的id是自增的我们不需要插入、时间是获取的双系统时间也不需要进行插入  我们在insert into 表名 后面把其余不能自动生成的字段加上
INSERT INTO 要插入数据的表名
SELECT DISTINCT  
字段1,字段2,字段3,
from  查询的表名

查看占用空间大小
SELECT 
sum(rows) as totalRows,--总行数
formatReadableSize(sum(data_uncompressed_bytes)) as data_uncompressed,--原始大小
formatReadableSize(sum(data_compressed_bytes)) as data_compressed,--压缩大小
round(sum(data_compressed_bytes) / sum(data_uncompressed_bytes) * 100, 0) as data_compressed_rate--压缩率
from system.parts
where database ='数据库' AND table ='表名'
              

复杂查询
1、例如单表中我们需要查询年级相同、班级相同、年龄不同的
SELECT t0.*
FROM  
(SELECT * from 表名  WHERE 条件
) as t0
LEFT JOIN 
(SELECT 字段名 from 表名  WHERE 条件
) as t1 ON 
t0.班级= t1.班级 AND t0.年级= t1.年级
WHERE t0.年龄!= t1.年龄


导出数据 到指定目录下面
SELECT * FROM 表名 WHERE 条件 INTO OUTFILE '/路径/test.txt';
可以是txt  也可以是csv  也可以是xls
如果要做筛选啥的还是xls格式好用  直接就是excel可以打开


修改字段名称
ALTER TABLE 表名 RENAME COLUMN 原始字段名TO 修改后的名字

修改字段数据类型
ALTER TABLE 表名  modify column 字段名  Nullable(String); 后面是要修改的数据类型    

删除数据
ALTER TABLE 数据库名.表名DELETE WHERE 条件

函数
if语句  判断是否为空 为空 返回 y  不为空 返回n
if(empty(''),'y','n')      

字符串切割 前提不能是Nullable类型 否则会报错
select  splitByChar('/', '2017/01/02')[1]  AS src

获取字符串长度
select LENGTH(splitByChar('/', '2017/1/02')[2]) as f

字符串拼接
select concat('0',splitByChar('/', '2017/1/02')[2]) as f

判断是否为空
IFNULL(字段名,-1)              

case when 语法
CASE WHEN 条件 THEN 满足添加的时候  else 不满足添加的时候  END


  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值