小编典典
preg_match_all("/([^\\\\]+)\\\\([^\\\\]+)/", $string, $p);
$array = array_combine($p[1], $p[2]);
现在,这当然是一个特例。 键 和 值 都以\反斜杠分隔,所有 键对 和 值 也是如此。由于必须进行两次转义,因此正则表达式也更长一些。
但是,可以将该方案推广到其他key:value,样式的字符串。
不同的key:value,分隔符
常见的变体包括:和=作为键/值分隔符,和,/ &和其他作为对定界符。在这种情况下,正则表达式变得非常明显(带有/x可读性标记):
# ↓ ↓ ↓
preg_match_all("/ ([^:]+) : ([^,]+) /x", $string, $p);
$array = array_combine($p[1], $p[2]);
这使得超级容易交流:和,其他分隔符。
等号=代替:冒号。
例如\\t作为对定界符(制表符分隔的键:值列表)
经典&或;作为键=值对之间的分隔符。
甚至只是\\s空格或\\n换行符。
允许使用不同的定界符
您可以通过在键/值/对之间使用不同的分隔符来使其更加灵活/宽容:
# ↓ ↓ ↓
preg_match_all("/ ([^:=]+) [:=]+ ([^,+&]+) /x", $string, $p);
两者key=value,key2:value2++key3==value3都会在哪里工作。对于更多的人际友好(AKA非技术用户),这可能更有意义。
约束字母数字键
通常,您可能要禁止除经典key标识符以外的任何内容。只需使用\w+字串模式即可使正则表达式跳过不必要的事件:
# ↓ ↓ ↓
preg_match_all("/ (\w+) = ([^,]+) /x", $string, $p);
这是最简单的白名单方法。如果是OTOH,您想预先 声明
/约束整个键/值字符串,则可以单独制作一个preg_match("/^(\w+=[^,]+(,|$))+/", …
删除空格或引用
您可以跳过一些后处理步骤(例如trim在键和值上),并添加少量内容:
preg_match_all("/ \s*([^=]+) \s*=\s* ([^,]+) (?
或例如可选引号:
preg_match_all("/ \s*([^=]+) \s*=\s* '? ([^,]+) (?
INI样式提取
您可以设计基准INI文件提取方法:
preg_match_all("/^ \s*(\w+) \s*=\s* ['\"]?(.+?)['\"]? \s* $/xm", $string, $p);
请注意,这只是普通INI方案的 粗略子集 。
如果您已经有一个key=value&key2=value2字符串,那么它parse_str就像一个符咒。但是通过与它结合strtr甚至可以处理其他定界符:
# ↓↓ ↑↑
parse_str(strtr($string, ":,", "=&"), $pairs);
它有两个 优点和缺点 :
甚至比两行正则表达式方法还短。
预定义一种众所周知的转义机制,例如%2F特殊字符)。
不允许在其中使用不同的定界符或未转义的定界符。
自动转换keys[]=为数组,您可能想要也可能不需要。
另类:explode+foreach
您会发现许多手动键/值字符串扩展的示例。尽管这通常是更多的代码。explode由于优化假设,在PHP中有些过度使用。分析后,由于手动foreach和数组收集,通常发现速度较慢。
2020-05-26