/*curl配合simple_html_dom的方法. 总结:file_get_html函数是结合了file_get_contents和load函数,而curl_exec函数的返回值相当于file_get_contents的返回值,如果再加上load函数就可以结合simple_html_dom解析使用!
require_once('simple_html_dom.php');
header("Content-type: text/html; charset=utf-8");
$ch = curl_init("http://m.byr.cn/user/login");
$info = 'id=****&passwd=****';
$cookie_jar = tempnam('./tmp','cookie');
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_POST, 1);
curl_setopt($ch, CURLOPT_POSTFIELDS, $info);
curl_setopt($ch, CURLOPT_COOKIEJAR, $cookie_jar);
curl_exec($ch);
curl_close($ch);
$curl2 = curl_init("http://m.byr.cn/");
curl_setopt($curl2, CURLOPT_HEADER, false);
curl_setopt($curl2, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($curl2, CURLOPT_COOKIEFILE, $cookie_jar);
$content = curl_exec($curl2);
curl_close($curl2);
$html = new simple_html_dom();
$html->load($content);
var_dump($html);
//print_r($html);//print_r函数如果遇到包含了直接或间接指向自身的引用,print_r将永远继续下去
*/
curl 是php中非常好用的模拟登陆的方法,simple_html_dom是php非常好用的html解析的方法,将这两个方法结合起来,对于php的抓取将会非常方便。
curl配合simple_html_dom的方法
最新推荐文章于 2021-06-04 08:40:16 发布