tidy 是一个整洁的HTML结合清理和修复工具,让您不仅干净,否则操作HTML文件,而且还遍历文档树。
windows下,在php.ini里,去除“;extension=php_tidy.dll”前面的“;”。就可以使用tidy扩展了。
extension=php_tidy.dll
[Tidy] tidy.clean_output = Off //是否开启自动 tidy功能。
整理 tidy::parseString、tidy_parse_string 解析字符串中存储的文档
修复 tidy::repairString -- tidy_repair_string 一个字符串使用一个可选提供的配置文件
- <?php
- $html = <<<EOD
- <html>
- <head>
- <title>test</title>
- </head>
- <body>
- <p>error<br>another line</i>
- EOD;
- $config = array('indent' => TRUE, //是否缩进
- 'output-xhtml' => TRUE,//是否是输出xhtml
- 'show-body-only'=>TRUE,//是否只获得到body
- 'wrap' => 200);
- //函数
- $tidy = tidy_parse_string($html, $config, 'UTF8');
- $tidy->cleanRepair();
- echo $tidy;
- //类
- $tidy = new Tidy;
- $tidy->parseString($html, $config, 'utf8');
- $tidy->cleanRepair();
- echo $tidy;
- //===========
- $clean = $tidy->repairString($html, $config, 'utf8');
- echo $clean;
参考:http://cn.php.net/manual/zh/class.tidy.php
config 配置说明:http://tidy.sourceforge.net/docs/quickref.html