正则表达式分割字符串单词和数字

string.split(separator,limit)

参数sepatator,limit是可选的;

separator可以是字符串正则表达式,limit是返回的数组的最大长度。

以JS为例,对于一个字符串

例如:var string = "gogo dasfj 77. 67.45 0.3 goie! sd-af ggjei? huiwoo 78.23? papfc asf. How 'are' you?";

想要拆分出单词数字比较麻烦,如果用空格进行匹配会有一些奇怪的东西混入单词或数字元素中。

由两种思路:

  1. 先用空格进行分割,再对各元素进行修正,也就是去掉其中不必要的标点符号;
  2. 匹配非目标成分直接用正则表达式分割。

第一种方法:

<script>
    var string = "gogo dasfj 77. 67.45 0.3 goie! sd-af ggjei? huiwoo 78.23? papfc asf. How 'are' you?";
    document.write(string + "<br>")
    var stringsp = string.split(" ");
    document.write(stringsp + "<br>-->" + stringsp.length + "<br>");
    for(x in stringsp) {
        stringsp[x] = stringsp[x].match(/[\w-]+(?:[\.]{1}[0-9]+)?/);
        document.write(stringsp[x] + "<br>");
    }
        document.write("结束<br>");
</script>

 运行结果:

[\w-]==[A-Za-z0-9_-],

(?:[\.]{1}[0-9]+)?匹配但不获取小数点+小数部分的数字子串。

第二种方法:

<script>
    var string = "gogo dasfj 77. 67.45 0.3 goie! sd-af ggjei? huiwoo 78.23? papfc asf. How 'are' you?";
    document.write(string + "<br>")
    //(?<!pattern)
    var patternsp = /[\.]{1}(?![0-9]+)[\s]*|[^\w-\.$]+/;
    var stringsp = string.split(patternsp);
    stringsp.pop();
    document.write(stringsp + "<br>-->" + stringsp.length + "<br>");
    for(x in stringsp) {
        document.write(stringsp[x] + "<br>");
    }
        document.write("结束<br>");
</script>

运行结果:

运行结果

思路:

  • 数字中的小数点和句子中的句号点冲突,先用区分两者;
  • [\.]{1}(?![0-9]+)[\s]*句子中的句号点及后面可能带有的空格,[\.]{1}(?![0-9]+)匹配后面不带数字的".";
  • 对拆分的子串使用[^\w-\.$]+拆分出单词和数字,屏蔽句子中的句号点的干扰。
  • 注意:末尾的标点符号也会参与拆分,最后数组尾部会带有一个""元素,需要pop()删除。
### 回答1: 使用 PHP 的正则表达式函数 preg_match() 可以匹配字符串。以下是一个示例: ```php $str = "Hello, World!"; $pattern = "/\bWorld\b/"; if (preg_match($pattern, $str)) { echo "Match found!"; } else { echo "Match not found."; } ``` 这段代码将输出 "Match found!",因为 $str 中包含单词 "World",并且 $pattern 中使用了单词边界 \b 进行匹配。请注意,正则表达式模式需要用斜杠 / 包围。 ### 回答2: PHP正则表达式是一种强大的字符串匹配工具,能够根据特定模式来匹配和处理字符串。在PHP中,可以使用preg_match函数来进行正则表达式的匹配。 preg_match函数接受三个参数,分别是正则表达式模式、目标字符串和可选的匹配结果输出变量。函数会在目标字符串中查找是否存在与正则表达式模式匹配的内容,如果匹配成功,则返回true,否则返回false。 正则表达式模式由特定的字符和符号组成,用于描述需要匹配的字符串规则。例如,使用\d可以匹配一个数字字符,\w可以匹配一个字母数字字符。 对于复杂的正则表达式模式,我们可以使用特定的字符类、量词和分组等特性来实现更准确的匹配。例如,使用[a-z]可以匹配一个小写字母,\d{2,4}可以匹配2到4个数字。 在进行匹配时,可以使用捕获组来提取感兴趣的部分字符串。捕获组是通过在正则表达式模式中使用小括号来定义的,使用圆括号包裹的部分将被定义为一个捕获组。 除了preg_match函数,PHP还提供了许多其他与正则表达式相关的函数,如preg_replace、preg_split等,用于替换、拆分和其他正则表达式操作。 总结来说,PHP正则表达式是一种强大的字符串匹配工具,可以根据特定的模式来匹配和处理字符串。在应用中,我们可以利用它来实现各种字符串操作,如验证、替换、拆分等。 ### 回答3: 在PHP中,正则表达式是一种强大的工具,用于匹配和处理字符串。它可以用于各种字符串操作,例如验证输入,提取数据以及替换特定的字符串。 使用正则表达式的基本步骤是: 1. 定义正则表达式模式,它由特定的字符和元字符组成,用于匹配目标字符串。 2. 使用preg_match函数进行匹配,该函数用于判断目标字符串是否与正则表达式模式匹配。如果匹配成功,则返回1;否则返回0。 3. 可以使用 preg_match_all函数来匹配目标字符串中的所有模式出现。 4. 使用preg_replace函数实现字符串中的替换操作,将匹配到的部分替换为指定的字符串。 5. 使用preg_split函数按照正则表达式模式分割字符串。 例如,如果我们想匹配一个字符串中是否包含数字,可以使用正则表达式模式"/\d/",其中\d表示数字。代码如下: ```php $str = "Hello,123 world"; if(preg_match("/\d/", $str)){ echo "字符串中包含了数字"; } else { echo "字符串中不包含数字"; } ``` 输出结果为:字符串中包含了数字。 以上是关于PHP正则表达式匹配字符串的基本操作,根据具体的需求和匹配规则,可以使用更复杂的模式和函数来实现更精确的匹配和处理。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值