用PHP实现简单的数据抓取
方法一:
<?php
$urlstr = file_get_contents("http://www.baidu.com");
$urlstr = htmlspecialchars($urlstr);
print_r($urlstr);
?>
方法二:(需要打开curl扩展)
注意:打开curl扩展时,一定要看看php加载php.ini文件的路径,通过phpinfo()函数就可以看到php挂载的php.ini文件路径。
<?php
//初始化curl
$ch = curl_init() or die (curl_error());
curl_setopt($ch,CURLOPT_URL,"http://www.baidu.com/s?wd=php"); //要求CURL返回数据
curl_setopt($ch,CURLOPT_RETURNTRANSFER,1); //执行请求
$result = curl_exec($ch) or die (curl_error()); //取得返回的结果,并显示
//echo $result;
$result = htmlspecialchars($result);
print_r($result);
curl_close($ch);
?>
得到页面静态源代码后,就可以通过正则帅选你想要的结果,很方便。