TP5 实现采集网页内容功能

于先生吖

于 2023-04-14 17:24:31 发布

阅读量338

点赞数

文章标签： php 开发语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_47736740/article/details/130158404

版权

最近遇到了一个功能，用PHP实现爬虫功能，采集网页内容并保存到数据库
接下来就写一下我是如何实现的
第一步、我们用composer下载querylist类

composer require jaeger/querylist

第二步、直接在控制器里开鲁

		use QL\QueryList;
		/** 
     * 自动采集
     */
    public function getArticleContent(){
        $urls = $this->request->param('urls');//根据前端传过来的url地址
        $ql = QueryList::get($urls);//使用类库解析当前URL地址
        $html = $ql->getHtml();//将url地址里的内容解码成HTML代码
        $title = QueryList::html($html)->find('.modal-title')->text();//获取html代码里class标签下的文本
        $author = QueryList::html($html)->find('.author')->text();
        $time = QueryList::html($html)->find('.time')->text();
        $content = QueryList::html($html)->find('#datacontent')->text();
        $data = [
            'title' => $title,
            'author' => $author,
            'createtime' => $time,
            'content' => $content
        ];
        db('gather_article')->insert($data);
        $this->success('采集成功');
    }

这是一个简单实现的流程。
这里不是所有的网页都可以用，你需要根据自己需求，比如说我要爬取小说，根据小说文章的html里面的标签来自定义获取的文本

以上就是tp5实现爬虫，采集网页内容的功能。
希望对各位老铁有帮助。如果有帮助记得关注收藏。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
TP5 实现采集网页内容功能

TP5 实现采集网页内容功能
复制链接

扫一扫

于先生吖 CSDN认证博客专家 CSDN认证企业博客

码龄4年

57: 原创

109万+: 周排名

3万+: 总排名

7万+: 访问

: 等级

771: 积分

84: 粉丝

70: 获赞

35: 评论

215: 收藏

私信

关注

热门文章

分类专栏

最新评论

PHP Thinkphp5.0实现抖音团购券码核销
码猿3888号: 抖音文档有个大坑,浪费了我很多时间,找到这里才解决!!! 抖音文档上面写:content-type 固定值"application/json" , 实际不是的, 是Content-type:multipart/form-data .不然你获取client_token会报错10002:参数错误, 巨坑啊这个写抖音文档的家伙!!找到这里才尝试写成multipart/form-data 就能获取到client_token了!!!
ThinkPHP 对接美团大众点评团购券(门票)
翼翼一: 能不能讲讲回调地址是根据什么设置，session、店铺id怎么获取能不能讲讲
使用接口api调用tp5验证码验证时一直提示失败的解决方案
gao1531774872: 非常有用的知识，问题已经解决了，困惑了我一天了，感谢博主！！！
PHP Thinkphp5.0对接美团API接口实现卡卷核销功能
四川大巴山网络科技有限公司: 请问下这个美团核销接口在那里可以开启，北极星审核了2个月还没动静
PHP Thinkphp5.0对接美团API接口实现卡卷核销功能
weixin_55282668: 大神美团核销券码应用总是未授权，这个怎么回事？明明按操作文档中的做了应用授权为什么没有记录呢？

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

于先生吖 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。