(开始匹配的内容)(.*)(结束匹配的内容)
例子一
要匹配的文档,要求:选取文档中的 p 标签中 的数字部分
<p style="2021169169997617797">系统进行各种形式的统计,</p>
<p style="1853169169997637628">例如频道访问的统计等。</p>
<p style="2527169169997655759">能够高速有效地得出一系列有关访</p>
<p style="13481691691028814420">问量方面的数据。</p>
正则表达式:(style=")(.*)(">)
(开始匹配以
style="
开头),接着用(.*)
(匹配任意单个字符,将前面的元素匹配0到多次),最后(匹配以">
结尾)
匹配结果:
共找到 4 处匹配:
style="2021169169997617797">
style="1853169169997637628">
style="2527169169997655759">
style="13481691691028814420">
例子二
需要匹配的文档,要求:选中p标签中拼音段落。
<p><b>《千字文》原文+译文+注解</b> </p>
<p>tiān dì xuán huáng yǔ zhòu hóng huāng rì yuè yíng zè chén xiù liè zhāng</p>
<p>天地玄黄 宇宙洪荒 日月盈昃 辰宿列张</p>
<p>【解释】天是青黑色的,地是黄色的,宇宙形成于混沌蒙昧的状态中。太阳正了又斜,月亮圆了又缺,星辰布满在无边的太空中。</p>
<p>〖注释〗盈:月光圆满。昃:太阳西斜。宿:我国天文学家将天空中某些星的集合体。</p>
<p>hán lái shǔ wǎng qiū shōu dōng cáng rùn yú chéng suì lǜ lǚ tiáo yáng</p>
<p>寒来暑往 秋收冬藏 闰馀成岁 律吕调阳</p>
<p>【解释】寒暑循环变换,来了又去,去了又来;秋天收割庄稼,冬天储藏粮食。积累数年的闰余并成一个月,放在闰年里;古人用六律六吕来调节阴阳。</p>
<p>〖注释〗律吕:中国古代将一个八度分为十二个不完全相等的半音,从低到高依次排列,每个半音称为一律,其中奇数各律叫做“律”,偶数各律叫做“吕”,总称“六律”、“六吕”,简称“律吕”。相传黄帝时伶伦制乐,用律吕以调阴阳。</p>
<p>yún téng zhì yǔ lù jié wéi shuāng jīn shēng lí shuǐ yù chū kūn gāng</p>
<p>云腾致雨 露结为霜 金生丽水 玉出昆冈</p>
<p>【解释】云气上升遇冷就形成了雨,夜里露水遇冷就凝结成霜。黄金产在金沙江,玉石出在昆仑山岗。</p>
<p>〖注释〗丽水:即丽江,又名金沙江,出产黄金。 昆冈:昆仑山。</p>
<p>jiàn hào jù què zhū chēng yè guāng guǒ zhēn lǐ nài cài zhòng jiè jiāng</p>
<p>剑号巨阙 珠称夜光 果珍李柰 重芥姜</p>
正则表达式:(<p>)([a-z])(.*)(a-z)(</p>)
开始匹配:以
<p>
标签开头,p标签后面紧接着是小写字母,用[a-z]
匹配“a”到“z”范围内的任意小写字母字符 ,用(.*)
(匹配任意单个字符,将前面的元素匹配0到多次),以(</p>)
结束,但是p标签结束标签很多,发现在p标签结束标签前面也是小写字母,那么再用[a-z]
匹配“a”到“z”范围内的任意小写字母字符 ,这样就解决问题,得到以下结果。
匹配结果:
<p>tiān dì xuán huáng yǔ zhòu hóng huāng rì yuè yíng zè chén xiù liè zhāng</p>
<p>hán lái shǔ wǎng qiū shōu dōng cáng rùn yú chéng suì lǜ lǚ tiáo yáng</p>
<p>yún téng zhì yǔ lù jié wéi shuāng jīn shēng lí shuǐ yù chū kūn gāng</p>
<p>jiàn hào jù què zhū chēng yè guāng guǒ zhēn lǐ nài cài zhòng jiè jiāng</p>