抓取网页并保存静态资源

本文介绍如何使用PHP来抓取网页内容,并详细阐述了如何保存网页中的静态资源,如图片、CSS和JavaScript文件,从而实现离线浏览或数据分析的目的。
摘要由CSDN通过智能技术生成

文件名:index.php

<?php
if($_GET['action'] == 'curl'){
   
    /**
     * 抓取指定页面的静态资源
     * @param $url
     * @return bool|string
     */
    function getUrl($url)
    {
   
        $headerArray = array("Content-type:application/json;", "Accept:application/json");
        $ch = curl_init();
        curl_setopt($ch, CURLOPT_URL, $url);
        //curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, FALSE);
        //curl_setopt($ch, CURLOPT_SSL_VERIFYHOST, FALSE);
        curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
        //curl_setopt($ch, CURLOPT_USERAGENT, 'Mozilla/5.0 (iPhone; CPU iPhone OS 13_2_3 like Mac OS X) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/13.0.3 Mobile/15E148 Safari/604.1');
        //curl_setopt($ch, CURLOPT_HTTPHEADER, $headerArray);
        $output = curl_exec($ch);
    	//echo '错误:',curl_error($ch),$output,PHP_EOL;
        curl_close($ch);
        return $output;
    }
    
    /**
     * 保存文件
     * @param $file
     * @param $content
     */
    function save($file, $content)
    {
   
        if (0 === strpos($file, 'http')) {
   
            echo $file, PHP_EOL;
            return;
        }
        $last = strripos($file, '/');
        $file = substr($file, 1);
        if (!$file)return;
        $dir = substr($file, 0, $last);
        
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值