php抓取网页内容,获取网页数据

本文介绍了如何使用PHP的simple_html_dom库来抓取网页内容,提取关键信息如图片、标题、观看人数、等级和价格,并将这些数据转化为JSON格式存储在本地的xxx.json文件中。代码实现包括引入库、获取HTML、定义数据结构、解析元素、生成JSON及文件写入。解析元素的方法类似jQuery,更多详情可参考相关文档。
摘要由CSDN通过智能技术生成

php通过simple_html_dom实现抓取网页内容,获取核心网页数据,将网页数据写入本地 xxx.json 文件

其代码实现逻辑:

1. 引入simple_html_dom.php文件

     

 require_once 'simple_html_dom-master/simple_html_dom.php';

2. 获取远程或者本地html文件

   

$html = file_get_html('./imooc.html');

3. 创建要获取数据的数组

    $cases =  Array();
    $arrImg = Array();

4. 获取当前网页所有案例图片、标题、观看人数、等级、价格

      foreach($html->find('.shizhan-course-wrap') as $element) 
       {
        $arrImg['img']  =  "http:".$element->find('.shizhan-course-img',0)->src;
        $arrImg['intro']  =  $element->find('.shizan-name',0)->plaintext;
        $arrImg['degree']  =  $element->f
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

我的小英短

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值