php 正则表达式匹配 html标签,使用正则表达式和php匹配未关闭的html标签

最新推荐文章于 2024-07-28 14:13:07 发布

KdbReboot

最新推荐文章于 2024-07-28 14:13:07 发布

阅读量155

点赞数

文章标签： php 正则表达式匹配 html标签

您可能没有意识到这一点,但DOMDocument可以帮助您修复HTML.

$html = "

Hello world

It's 7Am where I live

libxml_use_internal_errors(true);

$dom = new DOMDocument();

$dom->loadHTML('' . $html . '',LIBXML_HTML_NOIMPLIED | LIBXML_HTML_NODEFDTD);

$xpath = new DOMXPath($dom);

foreach( $xpath->query('//*[not(node())]') as $node ) {

$node->parentNode->removeChild($node);

}

echo substr($dom->saveHTML(),6,-8);

结果：< div>< h2> Hello world< / h2>< p>我住的地方是7Am< / p>< / div>

请注意,基于XPath的空节点清理是必要的,因为DOM包含空< h2>< / h2>,< p>< / p>和< div>< / div>将HTML加载到DOM后的标记.

< root>在开头添加元素以确保我们获得根元素.之后,我们可以使用substr进行后处理.

LIBXML_HTML_NOIMPLIED | LIBXML_HTML_NODEFDTD标志是必需的,因此没有DTD和其他垃圾没有添加到DOM.

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

KdbReboot

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

使用正则表达式 匹配 HTML 标签内的内容

我的博客

04-07

6076

使用正则表达式 匹配 HTML 标签内的内容 正则表达式如下 /(?<=((<.*?){0,}>))([\s\S]+)(?=(([\s]{0,1}<\/.*?>){1}))/g 测试例子： var regexp = /(?<=((<.*?){0,}>))([\s\S]+)(?=(([\s]{0,1}<\/.*?>){1}))/g // 简短的 html var str1 = `<div>hello</div>

php过滤HTML标签、属性等正则表达式汇总

10-25

主要介绍了php过滤HTML标签、属性等正则表达式汇总,本文使用代码实例给出了过滤HTML内容的正则表达式,具体说明请参阅代码中的注释,本文对使用PHP做采集的朋友有比较大的作用,需要的朋友可以参考下

参与评论您还未登录，请先登录后发表或查看评论

PHP正则匹配html标签

夏已微凉、

05-20

3798

PHP正则匹配html标签一、前言 1、匹配字符串时用：.*? 或 [^\<]+\ 或 [^\<]+ 2、preg_match匹配结果为1个，preg_match_all匹配结果为多个 3、如果有标签结束，则要加符号\，例如<\/div>，如果只需要匹配标签里的属性，就不需要匹配标签的结束符号<\/标签名> 4、preg_match_all匹配多个时，每一个()里...

php 正则表达式 匹配 html标签,PHP-php 用正则表达式 如何匹配成对的html标签？

weixin_35642587的博客

03-10

396

php纯正则很难实现这样复杂的匹配，必须做些逻辑处理，一下是正则加逻辑处理：$s = <<.....xxxxxxaaacontentshtml;$pattern = "/("."]*?)+s*>|"."s]+))?)*s*/?>|"."|"."".")/";preg_match_all($pattern, $s, $aMatches, PREG_OFFSET_CAPTURE...

用正则表达式匹配HTML标签

最新发布

yivifu的专栏

07-28

522

本文介绍了如何编写匹正则表达式匹配HTML标签，并给出了一个较复杂的应用问题——保留一段HTML片段中不带属性的div标签和p标签，但是删除带属性的div标签和p标签——的解决方案。

php 正则表达式 匹配 html标签,php 用正则表达式 如何匹配成对的html标签？

weixin_36038435的博客

03-10

413

php纯正则很难实现这样复杂的匹配，必须做些逻辑处理，一下是正则加逻辑处理：$s=<<.....xxxxxxaaacontentshtml;$pattern="/("."]*?)+\s*>|"."\s]+))?)*\s*\/?>|"."|"."".")/";preg_match_all($pattern,$s,$aMatches,PREG_OFFSET_CAP...

PHP 正则匹配 HTML 标签

FengHongSeXiaoXiang的博客

06-02

6087

$str = '<div class="subnav-title-name"><a href="http://www.autohome.com.cn/16/">一汽-大众-捷达</a></div>'; //两个rule 都可以匹配到数据 $rule = '/<div class="subnav-title-name">(.*?)<\/div>/ies'; $rule = '/<div class=\

php正则表达式匹配img中任意属性的方法

10-26

以上内容向我们展示了在PHP中使用正则表达式匹配和操作标签中属性的多种方法。掌握这些技巧，可以大大提高处理网页内容时的效率和准确性。对于经常需要进行类似操作的开发者来说，这些正则表达式的使用方法非常实用...

php用正则表达式匹配中文实例详解

10-26

在PHP中使用正则表达式匹配中文字符是一个常见需求，特别是在处理文本数据时，了解如何正确匹配至关重要。正则表达式是一种强大的文本处理工具，可以用来查找、匹配和替换字符串中的特定模式。对于中文字符，由于...

使用正则表达式去除所有html标签只保留文字

10-18

此外，正则表达式匹配时的贪婪模式和非贪婪模式对于匹配的结果有着决定性的作用。在上述示例中，使用了非贪婪的懒惰量词`+?`，这是为了在遇到嵌套标签时能够匹配到第一个闭合的标签，避免跨标签匹配的问题。为了...

PHP html标签正则替换并可自定义正则规则

10-29

PHP有个去除HTML标签的函数strip_tags，不过对于某些特殊符号不好使，下面这个函数的功能非常强大,同时用户还可以根据自己的需要进行正则替换.

PHP正则表达式过滤html标签属性(DEMO)

10-22

综上所述，通过使用PHP正则表达式进行HTML标签属性的过滤，开发者可以对Web页面内容进行更精细的控制，确保内容的安全性和有效性。这些过滤操作在处理用户输入的数据，或者在从外部源抓取内容时尤其重要。在实际应用...

php 正则匹配html标签

小白菜的专栏

08-23

6311

$html = ' &amp;lt;a id=&quot;01&quot; name=&quot;xkmlChoose&quot;&amp;gt;哲学&amp;lt;/a&amp;gt; &amp;lt;a id=&quot;02&quot; name=&am

PHP正则表达式匹配html标签之间内容

小虎哥－不可能变成可能

10-06

2091

假设网页内容如下： {eyou:arclist orderby='sort_order' row='8' subday='30' titlelen='42'} <a href="{$field.arcurl}">{$field.title}</a> {/eyou:arclist} {eyou:sql sql='xxxxxxxx'} <span>不支持sql标签</span> {/eyou:sql } {eyou:arclist orde

php正则过滤html标签_空格_换行符的代码,php正则过滤html标签、空格、换行符的代码(附说明)...

weixin_35227213的博客

03-20

$str=preg_replace("/\s+/", " ", $str); //过滤多余回车$str=preg_replace("/$str=preg_replace("//si","",$str); //注释$str=preg_replace("//si","",$str); //过滤DOCTYPE$str=preg_replace("//si","",$str); //过滤html标签$st...

php 获取html属性值,PHP_正值表达式匹配html标签的属性值，正则表达式是做文本解析工作 - phpStudy...

weixin_39906114的博客

06-04

441

正值表达式匹配html标签的属性值正则表达式是做文本解析工作必不可少的技能。如Web服务器日志分析，网页前端开发等。很多高级文本编辑器都支持正则表达式的一个子集，熟练掌握正则表达式，经常能够使你的一些工作事半功倍。例如统计代码行数，只需一个正则就搞定。嵌套Html标签的匹配是正则表达式应用中一个比较难的话题，因为它涉及到的正则语法比较多，也比较难。因此也就更有研究的价值。今天由于工作的需求，需要获...

php 正则表达式解析html,php正则表达式解析html

weixin_39763953的博客

03-21

205

php正则表达式解析htmlJamesLiu•2018 年 11 月 25 日常用表达式找到某个标签(如table标签)preg_match("/]*?>(.*?)/s",$file_contents,$match);去掉tr前标签(其它标签同样适用)$table = preg_replace("']*?>'si","",$table);$table = preg_replace(...

PHP正则表达式匹配教程

很酷的站长的博客

08-18

809

正则表达式是一种用于搜索、匹配、替换某种文本的字符串模式，常用于处理文本数据、校验输入数据等。在PHP中，可以使用preg系列函数（preg_match、preg_replace等）处理正则表达式。

php 正则表达式 匹配 html标签,使用正则表达式和php匹配未关闭的html标签

Hello world

php 正则表达式匹配 html标签,使用正则表达式和php匹配未关闭的html标签