冷静,我们是专业的
今天想用正则表达式更改 clickhouse
建表语句的表引擎,遇到了坑爹的问题。
"ENGINE = ReplicatedMergeTree(\n" +
" '/clickhouse/tables/{shard}/ihap_stream/ihap_cc_case_v2_local',\n" +
" '{replica}'\n" +
") PARTITION BY toYYYYMMDD(parseDateTimeBestEffort(ctime))"
替换为
"MergeTree() PARTITION BY toYYYYMMDD(parseDateTimeBestEffort(ctime))"
第一步搞定正则
很简单,.
匹配所有字符,即 ReplicatedMergeTree\(.*\)
,试一把,我靠0条匹配。
不慌继续,原来是换行符在作怪,即 ReplicatedMergeTree\([.\n]*\)
,试一把,嘛的0条匹配。
冷静,我们是专业的,抽个烟在回来,即 ReplicatedMergeTree\([\s\S]*\)
,试一把,牛逼1条匹配,貌似多了个尾巴。
简单,贪婪匹配嘛,只匹配第一个小括号就够了,即 ReplicatedMergeTree\([\s\S]*?\)
,完美解决。
第二步 Java 实现一把
怎么简单的代码还要测吗,直接发线上去!!!
String str = "ENGINE = ReplicatedMergeTree(\n" +
" '/clickhouse/tables/{shard}/ihap_stream/ihap_cc_case_v2_local',\n" +
" '{replica}'\n" +
") PARTITION BY toYYYYMMDD(parseDateTimeBestEffort(ctime))";
String replace = str.replace("ReplicatedMergeTree\\([\\s\\S]*?\\)", "MergeTree() ");
System.out.println(replace);
我靠,怎么没帮我把表建出来,看下日志,语法错误,咦 怎么没有帮我替换调呢?
省略几小时。。。。。
第二天 2021年01月01日
搞不定呀!
心理默念一句,冷静冷静,我们是专业的。
当初学正则的时候好像专门有个regex的包,要不用那个专业的正则对象来调试一下,字符串毕竟不是亲生的呀。
直接上代码。
String str = "ENGINE = ReplicatedMergeTree(\n" +
" '/clickhouse/tables/{shard}/ihap_stream/ihap_cc_case_v2_local',\n" +
" '{replica}'\n" +
") PARTITION BY toYYYYMMDD(parseDateTimeBestEffort(ctime))";
String replace = Pattern.compile("ReplicatedMergeTree\\([\\s\\S]*?\\)").matcher(str).replaceAll("MergeTree() ");
System.out.println(replace);
运行一把,问题解决!!!
我靠,什么原因啊,字符串的正则匹配有bug啊!JDK的社区在哪里,我要提个ISSUE。