正则：匹配文本首和尾

最新推荐文章于 2022-10-12 17:46:20 发布

hsany330

最新推荐文章于 2022-10-12 17:46:20 发布

阅读量5.2k

点赞数 2

有的时候，我们想要匹配的字符串必须位于全部文本的首位，比如说 XML 文件的声明“<?xml version="1.0" encoding="UTF-8" ?>”；有的时候，需要匹配的字符串位于全部文本的末尾，比如</html>。对于这种匹配，上面介绍的单词边界匹配就无能为力了。

匹配文本首

在正则表达式中，可以在匹配模式的第一个字符前添加 “^”，以匹配满足模式且位于全部文本之首的字符串。可以将它的匹配方式理解成这样：

假设不存在“^”，进行一个正常匹配，将所有匹配的文本保存到匹配集合中；
在匹配集合中寻找位于所搜索的文本首位的匹配；
从匹配集合中删除其他匹配，仅保留该匹配。

正则如下：

^(\s*nowamagic\d?\.net)

效果演示

nowamagic.net and nowamagic2.net are websites.

本例代码

function reg_replace()
{
	var test = document.getElementById("test");
	var regex = /^(\s*nowamagic\d?\.net)/g;
	test.innerHTML = test.innerHTML.replace(regex,"<span style='background-color:orange'>$1</span>");
}

我们进行文本边界匹配时，通常还需要添加对空字符的处理所以需要在字符串前加上\s*

按照之前说的，它的匹配过程是这样：

假设匹配模式是 nowamagic\d?\.net，对文本进行匹配。
一共找到 2 个符合模式的文本：第一行和第二行的 nowamagic.net, 及 nowamagic2.net
从所有匹配的文本中筛选出位于文本首位的匹配文本：即第一行的 nowamagic.net，删除所有其他匹配。

匹配文本末

有匹配文本首的语法，自然有匹配文本末的语法。

在正则表达式中，可以在匹配模式的最后一个字符后添加 “$”，以匹配满足模式且位于全部文本之末的字符串。

它的匹配方式与匹配文本首“^”相似，这里就不再详细说明了，只给出一个例子：

正则如下：

(nowamagic\d?\.net\s*)$

效果演示

nowamagic.net and nowamagic2.net are both names nowamagic.net

回顾下之前介绍的，可以看出：“\b”和“\B”是对匹配模式(表达式) 中某个字符出现的进行位置(单词首位还是末位)进行限制。“^”和“$” 是对整个待搜索文本的匹配模式(表达式) 出现位置(文本首位还是文本末位)进行限制。它们的关系是一小一大。

hsany330

关注

2
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
正则：匹配文本首和尾

有的时候，我们想要匹配的字符串必须位于全部文本的首位，比如说 XML 文件的声明“”；有的时候，需要匹配的字符串位于全部文本的末尾，比如。对于这种匹配，上面介绍的单词边界匹配就无能为力了。匹配文本首在正则表达式中，可以在匹配模式的第一个字符前添加 “^”，以匹配满足模式且位于全部文本之首的字符串。可以将它的匹配方式理解成这样：假设不存在“^”，进行一个正常匹配，将所有
复制链接

扫一扫