第一步:通过curl抓取网页
$url = url;
$ch = curl_init();
curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, FALSE); // https请求 不验证证书和hosts
curl_setopt($ch, CURLOPT_SSL_VERIFYHOST, FALSE);
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); // 要求结果为字符串且输出到屏幕上
curl_setopt($ch, CURLOPT_HEADER, 0); // 不要http header 加快效率
curl_setopt($ch, CURLOPT_USERAGENT, 'Mozilla/5.0 (compatible; MSIE 5.01; Windows NT 5.0)');
curl_setopt($ch, CURLOPT_TIMEOUT, 15);
$output = curl_exec($ch);
curl_close($ch);
第二步:抓取想要的信息
$preg = //此处为正则表达式;
preg_match_all($preg,$html,$out);
//例如
$preg = '/<div\sclass=\"list-group\">(.*?)<\/div>/';
preg_match_all($preg,$output,$out);
//得出的的$out 就是想要的信息
注意:想要准确抓取,需先了解正则表达式。