简介:
header('Content-Type:text/html;charset=utf-8');
/**
* 一个用于抓去图片的类
*/
class download_image {
public $_save_path = NULL; //图片保存路劲
public $_limit_size = NULL; //图片限制大小
public static $_img_url_old = array(); //存储已抓取过的图片链接地址
public static $_a_page_url = array(); //存储抓取过的页面
public function __construct( $_save_path, $_limit_size) {
$this->_save_path = $_save_path;
$this->_limit_size = $_limit_size;
}
public function get_all_page_image( $site_url ) {
if ( $site_url == '' ) {
return false;
}
if ( ! in_array( $site_url, self::$_a_page_url ) ) { //判断当前页面是否抓取过
self::$_a_page_url[] = $site_url; //将超链接存入静态数组中
} else {
return; //若抓取过则跳出
}
1.找到一个页面
2.正则过滤所有的img
3.正则过滤出所有的src的属性
4.获取链接信息,写入文件 file_get_contents(), file_put_contents()
5.在cli模式下运行代码(浏览器运行可能内存爆掉,或运行超时)