问题
我这里是使用Clickhouse对接Kafka消息,建立源表,物化视图并把数据存至目标表。在物化视图中需要对消息进行解析提取关键字段,用到了Clickhouse中的JSONExtractString函数,问题就出在这里。
原因
在测试环境中,使用的Clickhouse版本是23,在23版本中是没有这个问题的。
生产环境中Clickhouse版本是24,因为在24版本中,默认使用simdjson这个东西,simdjson可以加快Json解析的速度,但由于这个版本可能没有装simdjson,导致JSONExtractString解析失败。
但23版本中是不使用simdjson的,所以没有问题。
现象
在24版本中,同样的两条SQL,不使用simdjson可以成功,使用就会报错。
SELECT JSONExtractString('{\"event_name\":\"1111\"}', 'event_name') AS event_name SETTINGS allow_simdjson = FALSE ;
SELECT JSONExtractString('{\"event_name\":\"1111\"}', 'event_name') AS event_name SETTINGS allow_simdjson = TRUE;
解决方案
方案1:在配置文件中,禁用此参数
<allow_simdjson>false</allow_simdjson>
方案2:安装simdjson。
我这里使用的是方案1,不使用simdjson解析速度也挺快的。方案2没有试过~