OCS 2007、LYNC和正则表达式

最新推荐文章于 2022-01-21 09:25:52 发布

weixin_34232617

最新推荐文章于 2022-01-21 09:25:52 发布

阅读量117

点赞数

原文链接：http://blog.51cto.com/ucworld/441917

版权

在微软的OCS和LYNC中，有一个相对有点难度的知识点就是正则表达式（Regular Expression）了。如果要弄企业语音就一定会面对这个正则表达式这个问题了。今天我们就来聊聊OCS和LYNC内的正则表达式。

什么是正则表达式？我们为什么要弄正则表达式？首先我们要回答这个问题。正则表达式就是计算机用来处理字符串的，把我们所输入的一般性的东西经过正则表达式处理之后变成计算机用的规范性的东西。在OCS里面，我们会在三个地方碰到正则表达式：

第一个：由于OCS需要E.164格式的号码。所以在处理用户在OC或者LYNC客户端输入的电话号码时，用户所输入的非规范性的号码需要经过正则表达式处理之后变成规范的字符串。比如说用户拨打一个北京的座机号码，他输入了01012345678，OCS需要把号码转变成+861012345678。这个转变过程就是由正则表达式所完成的。

第二个地方：在OCS把号码送到中介服务器的时候。在这里需要由正则表达式来完成匹配工作。比如如果一个北京的用户被授权只能拨打本地的电话的话，那么+862112345678（上海号码）就不能被送到中介服务器上去。这个时候也是由正则表达式来完成匹配的。

第三个地方：用户在AD里面可能会有一些和电话有关的属性字段，在OCS生成地址簿文件的过程中，用户的号码也要被规范化，这个过程中，又是正则表达式在起作用。

所以说我们可以这里来理解正则表达式，它就是一个小盒子，非规范的字符串在经过这个盒子之后就成规范的了。这个处理过程我们就成为匹配。

正则表达式是什么样子的呢？我们来看看它的庐山真面目：

\+?[\s()\-\./]*1?[\s()\-\./]*$?\s*([2-9]\d\d)\s*$?[\s()\-\./]*(\d\d\d)[\s()\-\./]*(\d\d\d\d)[\s]*

看得头晕了吧，上面的字符串就是一个正则表达式。很是复杂。相信看完本文，你就可以看懂了这些奇怪的符号的意思了。为什么要弄这么复杂，因为用户的输入是千奇百怪的，为了处理这些千奇百怪，我们的正则表达式就要考虑到所有的情况，所以就变得复杂了。但是它也是有规律的，只要学了基本概念，你也可以轻松地看懂上面的内容。

网上有很多的正则表达式的教程，我今天就比较有针对性只是讲和OCS或者LYNC有关的地方了。如果大家还想进一步研究，可以去google一下了。

在OCS里面的正则表达式打交道，我们需要提前记住一些正则表达式的一些基本内容。

这里我们就先记几个在OCS里面非常常见的符号。

符号	表示意思
\	如果出现这个，就意味着它后面的字符是一个字符。计算机就不处理这个字符原本所的意思了。实例：因为+也是一个正则表达式内的特殊符号，所以如果我们只是要这个+号的本意，我们就要在前面加\来告诉计算机不要特殊对待这个+号。
?	说面?号前面的表达式可能出现也可能不出现。实例：+? 表示这个+可能出现，也可能不出现
*	前面的表达式出现多次或者一次也没有出现实例:12*表示1（未出现）或者122（出现一次）
\s	代表空格
\d	匹配一个数字
^	匹配输入字符串的开始
$	匹配输入字符串的结尾
\|	并列
[xyz]	xyz3个字符的合集，匹配里面的任意一个字符，匹配之后不存储
()	匹配括弧里的字符串，但是要储存
{}	大括弧里面为要匹配的次数，实例：{2}表示前面的字符要匹配2次
[^xyz]	不包含xyz的字符合集