php 匹配div正则表达式,Php正则表达式匹配div

最新推荐文章于 2021-03-19 05:22:24 发布

weixin_39747595

最新推荐文章于 2021-03-19 05:22:24 发布

阅读量1k

点赞数

文章标签： php 匹配div正则表达式

Use an HTML parser. NOT regular expressions.

正则表达式的问题在于它们无法匹配嵌套结构.假设你的正则表达式必须匹配单个< div>及其结束标记,无法正确匹配此输入：

Foo

Bar

因为如果你的正则表达式是贪婪的,它将匹配最上面的两个div,如果它不合适,它将与正确的结束标记不匹配.

因此,您应该使用HTML解析器.使用PHP,DOMDocument::loadHTML或DOMDocument::loadHTMLFile,每个都做得相当不错. (您可以“安全地”忽略它生成的警告：它们只是标记错误,生成的DOMDocument对象应该非常好.)

由于PHP getElementById很难开始工作,因此您可以将DOMXpath用于同一目的：

$url = "http://urlchecker.net/html/demo.html";

$d = new DOMDocument();

$d->loadHTMLFile($url);

$xpath = new DOMXPath($d);

$myNews = $xpath->query('//@id="news-id-160346"')->item(0);

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_39747595

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

XPath 文本匹配：正则表达式的应用与技巧

小蓝枣的博客

07-13

2759

XPath 是一种强大的查询语言，用于在 XML 和 HTML 文档中定位和提取元素。正则表达式是一种强大的模式匹配工具，可以用来进行复杂的文本匹配。 XPath 结合正则表达式的使用，可以实现更精确和灵活的文本匹配和定位。本篇博客将深入探讨 XPath 中使用正则表达式进行文本匹配的方法和技巧，通过详细的解释和实例演示，展示它在元素筛选和定位方面的优势和灵活性。

php过滤HTML标签、属性等正则表达式汇总

10-25

主要介绍了php过滤HTML标签、属性等正则表达式汇总,本文使用代码实例给出了过滤HTML内容的正则表达式,具体说明请参阅代码中的注释,本文对使用PHP做采集的朋友有比较大的作用,需要的朋友可以参考下

参与评论您还未登录，请先登录后发表或查看评论

php 匹配div正则表达式,正则表达式匹配所有php标签对

weixin_33599503的博客

03-10

383

我的第一个想法是使用tokenizer，但经过一些测试后，似乎这个人无法识别短开的php标签。我决定编写一个描述两个陷阱的模式：注释和字符串。$str = << $b = '?>';$c = '';$d = '';$e = '';$a = 1;?> ?>';EOD;$pattern = <<~# subpatterns definitions(?(DEF...

php正则匹配嵌套的div

hoooooly的博客

05-16

3361

$strContentInfo = '<div class="abc"><div class="def">内容</div></div>';$strContentInfo = preg_replace('/<div class[^>].*?>(?>[^<\/div>]+|(?

php正则匹配 <div></div>

adad4220的博客

05-27

304

问题是正则直接读到末尾了，而我需要的只是到第一个</div>为止。 <div class="proxylistitem"> <div style="float:left; display:block; width:630px;"> 　　　　　　<span>...</span>　　　　　　...

php 正则div内容,正则表达式php – 使用特定ID在div中查找内容

weixin_31931045的博客

03-11

430

我确信这是一个简单的问题,就像我在谷歌上搜索和搜索一样 – 我似乎无法弄清楚这有什么问题.我在这个页面上有其他区域,我使用类似的表达式,返回我想要的.但是,我不能得到这个特别的东西来回报我想要的东西,所以也许有人可以帮助我.我有一个具有特定ID“div-user-sub-commhome”的div – 我想从该div中提取文本.文本被标签包围但我可以轻松地使用strip_tags来获取那些标签....

JavaScript正则表达式匹配 div style标签

10-22

下面是一个简单的JavaScript示例代码，展示如何使用正则表达式匹配`<div>`和`<style>`标签： ```javascript // 示例字符串，包含div和style标签 var htmlString = '<div>这是一个div标签的内容。这是style标签中的...

正则表达式匹配闭合HTML标签(支持嵌套)

10-15

通过给匹配的子表达式指定一个名字，可以在正则表达式后续的引用中直接使用这个名字，这样做的好处是提高了正则表达式的可读性，尤其是对于复杂的正则表达式，这种做法可以让代码更加清晰易懂。举例来说，正则...

正则表达式匹配任意字符（包括换行符）的写法

12-11

于是查了一下手册，才发现正则表达式中，“.”(点符号)匹配的是除了换行符“\n”以外的所有字符。同时，手册上还有一句话：要匹配包括 ‘\n’ 在内的任何字符，请使用像 ‘[.\n]’ 的模式。于是我将正则表达式的匹配...

php正则匹配html中带class的div并选取其中内容的方法

12-19

本文实例讲述了php正则匹配html中带class的div并选取其中内容的方法。分享给大家供大家参考。具体分析如下：先看一段html代码：复制代码代码如下:<div class=”chartInfo”> <div class=”line”></div> <div class=”tideTable”> <strong>潮汐表</strong>数据仅供参考 <table width=”500″ border=”0″ cellspacing=”0″ cellpadding=”0″> <tbody><tr> <td width=”100″>

PHP获取远程div内容

05-20

PHP获取远程div内容

PHP正则表达式匹配嵌套HTML标签的方法和技巧

热门推荐

Lyndon的专栏

06-29

2万+

正则表达式是一个非常有用的编程技能。一般来说，简单的抓取一个HTML页面的某一条信息，比如<title>标题</title>，是很容易实现的。但是，我们往往要抓取某一个列表页面里的多个重复的<div></div>块里的特定内容，并且<div></div>块还有嵌套的使用，我们抓取的则是每个重复<div></div>块里的多个信息。同时，网页源文件不同于一般的字符串，其还存在大量的回车、换行和制表符，这些都造成了匹配失败。而初学者往往无法判断到底是哪个环节出现了问题，并且看到高度技巧化的正则表达式会感到非常沮

php正则匹配html中的带class的div，选取其中的内容

ywq5752952的专栏

01-08

4174

潮汐表数据仅供参考潮时 (Hrs) 00:58 05:20

p标包含div 正则表达式_正则表达式匹配闭合HTML标签(支持嵌套)

weixin_34569101的博客

01-14

598

任何复杂的正则表达式都是由简单的子表达式组成的，要想写出复杂的正则来，一方面需要有化繁为简的功底，另外一方面，我们需要从正则引擎的角度去思考问题。关于正则引擎的原理，推荐《Mastering Regular Expression》中文名叫《精通正则表达式》。挺不错的一本书。OK，先确定我们要解决的问题——从一段Html文本中找出特定id的标签的innerHTML。这里面最大的难点就是，Html标签...

PHP 正则

curtain的专栏

10-28

232

1.PHP正则替换指定div内容 $html = 'jjjjj ¥ helloWord'; //$reg = '/.*?(\t|\r\n|\n|\s)*/is'; $reg = '/.*?(\t|\r\n|\n|\s)*/is'; $res = preg_replace($reg,"",$htm

php 正则div 所有内容,php正则匹配html中带class的div并选取其中内容的方法，classdiv_PHP教程...

weixin_33474462的博客

03-19

547

php正则匹配html中带class的div并选取其中内容的方法，classdiv本文实例讲述了php正则匹配html中带class的div并选取其中内容的方法。分享给大家供大家参考。具体分析如下：先看一段html代码：代码如下:潮汐表数据仅供参考潮时 (Hrs)00:5805:2013:2821:15潮高 (cm)16175288127时区：-1000 (东10区) 潮高基准面：在平均海平面下...

KKобтьу╬kkx.net.url