cURL是一个利用URL语法规定来传输文件和数据的工具,支持很多协议,如HTTP、FTP、TELNET等。
最爽的是,PHP也支持 cURL库。
cURL的强大功能,基本可以模拟用户的鼠标点击等操作,还有更多功能在本文中就不详细解释了。
// 1. 初始化
$ch = curl_init();
// 2. 设置选项,包括URL
curl_setopt($ch, CURLOPT_URL, "http://blog.7cuu.com");
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_HEADER, 0);
// 3. 执行并获取HTML文档内容
$output = curl_exec($ch);
// 4. 释放curl句柄
curl_close($ch);
这就是基本的使用了,中间只要增加echo就可以输出网页来了
下面再来详细介绍如果需要登录的页面怎么导入呢?
大家都知道,网站的登陆都是使用的cookie来保存登录记录的,只要想办法得到了cookie就可以抓去导入的内容了。
// 1. 初始化
$url = "http://blog.7cuu.com/index.php?mod=user&act=login";
$post_data = Array(
"username" => "ceshi",
"password" => "ceshi123",
"remember" => "1",
"from" => "http://blog.7cuu.com/index.php?mod=user&act=register"
);
$cookie_file = dirname(luoe_file)."/cookie.txt";
$ch = curl_init();// 2. 设置选项,包括URL
curl_setopt($ch, CURLOPT_URL, "$url");curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, 0 ); // 对认证证书来源的检查
curl_setopt($ch, CURLOPT_SSL_VERIFYHOST, 1 ); // 从证书中检查SSL加密算法是否存在
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_HEADER, 0);
curl_setopt($ch, CURLOPT_TIMEOUT, 30);
curl_setopt($ch, CURLOPT_FOLLOWLOCATION,1); //是否抓取跳转后的页面
//3. 准备post数字
curl_setopt($ch, CURLOPT_POST, 1);
curl_setopt($ch, CURLOPT_POSTFIELDS, $post_data);
//连接关闭以后,存放cookie信息的文件名称
curl_setopt($ch, CURLOPT_COOKIEJAR, $cookie_file);
// 包含cookie信息的文件名称,这个cookie文件可以是Netscape格式或者HTTP风格的header信息。
curl_setopt($ch, CURLOPT_COOKIEFILE, $cookie_file);
//
$output = curl_exec($ch);
curl_close($ch);
echo $output;
这样就可以把cookie保存到当前目录中来了,下次在给大家介绍登录之后的操作了!