背景
项目重构过程中,我们采取尽量避开正则操作,但是事与愿违,还是有场景用正则,结果就踩了个大小写的坑
PHP版正则
/(https|http):\/\/(item|item.m)\.(jd)\.(com|hk)(\/product)?\/(\d+)\.html/i
PHP版正则提取了多个地方的数据,但是只用了其中的id, 并且忽略大小写,如果你把正则原封不动的甩到golang正则编译器里,绝对报错,原因是两种语言的大小写语法不通
GO版正则
(?i)(https|http):\/\/(item|item.m)\.(jd)\.(com|hk)(\/product)?\/(\d+)\.html
差别就在PHP版是与市面上正则规则保持一致,在末尾用/i来表示,而golang得放在最前面,使用(?i)才行,另外,golang不需要前后的/
既然我们不需要提取这么多,那么我们就把多余的提取忽略掉,这里用到正则的一个语法 ?: ,把它放在要提取的数据里就能忽略提取了,我估计一开始写PHP版的同学,并不是为了提取而是为了()来搞 | 关系。。。
go版的优化结果
(?i)(?:https|http):\/\/(?:item|item.m)\.(?:jd)\.(?:com|hk)(?:\/product)?\/(\d+)\.html
我们只提取id就好了嘛,是吧