正则:匹配文本首和尾

有的时候,我们想要匹配的字符串必须位于全部文本的首位,比如说 XML 文件的声明“<?xml version="1.0" encoding="UTF-8" ?>”;有的时候,需要匹配的字符串位于全部文本的末尾,比如</html>。对于这种匹配,上面介绍的单词边界匹配就无能为力了。

匹配文本首

在正则表达式中,可以在 匹配模式 的第一个字符前添加 “^”,以匹配 满足模式且位于全部文本之首的字符串。可以将它的匹配方式理解成这样:

  1. 假设不存在“^”,进行一个正常匹配,将所有匹配的文本保存到匹配集合中;
  2. 在匹配集合中寻找位于 所搜索的文本 首位的匹配;
  3. 从匹配集合中删除其他匹配,仅保留该匹配。

正则如下:

^(\s*nowamagic\d?\.net)
效果演示
nowamagic.net and nowamagic2.net are websites.

本例代码
function reg_replace()
{
	var test = document.getElementById("test");
	var regex = /^(\s*nowamagic\d?\.net)/g;
	test.innerHTML = test.innerHTML.replace(regex,"<span style='background-color:orange'>$1</span>");
}

我们进行文本边界匹配时,通常还需要添加对空字符的处理所以需要在字符串前加上\s*

按照之前说的,它的匹配过程是这样:

  1. 假设匹配模式是 nowamagic\d?\.net,对文本进行匹配。
  2. 一共找到 2 个符合模式的文本:第一行 和 第二行的 nowamagic.net, 及 nowamagic2.net
  3. 从所有匹配的文本中筛选出位于文本首位的匹配文本:即第一行的 nowamagic.net,删除所有其他匹配。
匹配文本末

有匹配文本首的语法,自然有匹配文本末的语法。

在正则表达式中,可以在 匹配模式 的最后一个字符后添加 “$”,以匹配 满足模式且位于全部文本之末的字符串。

它的匹配方式 与 匹配文本首“^”相似,这里就不再详细说明了,只给出一个例子:

正则如下:

(nowamagic\d?\.net\s*)$
效果演示
nowamagic.net and nowamagic2.net are both names nowamagic.net

回顾下之前介绍的,可以看出:“\b”和“\B”是对 匹配模式(表达式) 中某个字符出现的进行位置(单词首位还是末位)进行限制。“^”和“$” 是对 整个待搜索文本 的 匹配模式(表达式) 出现位置(文本首位还是文本末位)进行限制。它们的关系是一小一大。


  • 2
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值