问题如题,先上html文件,需要取里面的body内容,直接上代码:
你好你好接着是php代码:
/**
* 在html文件中找出正文
* Created by PhpStorm.
* User: Administrator
* Date: 2016/11/15
* Time: 21:43
*/
$filename = '8/index.html';
$res = get_body_from_html($filename);
var_dump($res);
/**
* 在html文件中找出正文
* @param $filename string 路径url
* @return array|bool
*/
function get_body_from_html($filename)
{
if (!file_exists($filename)) {
return false;
}
$file = file_get_contents($filename);
$res = array();
preg_match('/
(.*)/', $file, $res);return $res;
}
运行之后发现:
array(0) { }
如果里面的方法改为:
function get_body_from_html($filename)
{
if (!file_exists($filename)) {
return false;
}
// $file = file_get_contents($filename);
$file = '
你好>$res = array();
preg_match('/
(.*)/', $file, $res);return $res;
}
运行之后就可以正确输出:
array(2) {
[0]=>
string(42) "
[1]=>
string(29) "
}
所以要请教一下为何写的正则抓不到内容呢?