只是遇到了同样的问题。我几乎写了一个递归函数来检查每个tbody标记是否存在,并以这种方式遍历dom,然后我记得我知道regex。*)
在解析之前,将html作为字符串获取。插入缺失
和使用regex标记,然后将其加载回DOMDocument对象中。Jens Erat给出了一个很好的解释,但以下是
解决方案4:确保HTML源始终具有
带正则表达式的标记JavaScriptvar html = '
foo | bar |
html.replace(/(
/g,"$1
$4");PHP
$html = $dom->saveHTML();
$html = preg_replace(array('/(
array('$1
','$1$4'),$html);$dom->loadHTML($html);
只是裁判官:matches `
also with stuff inside the tag
/(
replace with
$1
the $1 referencing the captured `Do the same for the closing tag like this:
/(]+)?>)(]+)?>)/
replace with
$1$4
这样,多姆将永远拥有
必要时贴标签。