curl ——爬网页数据

最新推荐文章于 2022-01-03 22:53:12 发布

Echo__Lin

最新推荐文章于 2022-01-03 22:53:12 发布

阅读量2k

点赞数

分类专栏：学习笔记-curl

本文链接：https://blog.csdn.net/last_sharly/article/details/45027811

版权

学习笔记-curl 专栏收录该内容

7 篇文章 0 订阅

订阅专栏

爬厦门大学官网（http://www.xmu.edu.cn）页面上厦大新闻栏目下的标题。这里写图片描述
接下来单击鼠标右键->审查元素->Network->√preserve log->刷新页面，重载网页。

滚动条拉到最上面，www.xmu.edu.cn->preview，找到厦大新闻的标签下，发现并没有具体的新闻条目，故看其他Path。往下翻翻翻，哈哈~找到了一个名字是news_text_list.html的文件，听着名字就像是新闻列表，点击进入response，
这里写图片描述
发现里面的数据确实是厦大新闻的内容，所以我们找对啦~
点击headers看下具体信息

找到requestURL，复制下，一会儿用~

接下来就是代码代码啦~

第一步看看自己curl得到的网页信息:
这里写图片描述
下面是运行php之后的页面

完美的得到了新闻的信息。
接下来就是要对立面的信息信息用explode()函数进行切割，取出需要的信息~

先分析一下信息：
每一个标题都是一个标签。

<a href="http://news.xmu.edu.cn/s/13/t/542/79/42/info162114.htm" title="中化集团原副总裁罗东江畅谈国企市场化改革" target="_blank">» 中化集团原副总裁罗东江畅谈国企市场化改革</a>

而我们要取得信息是title=”这里的内容”，所以我们分两步进行切割。
第一步：以title=“为切割点。
这里写图片描述
运行php得到

接下来进行第二次切割。

运行之后

点击右键->查看网页源代码

这样我们就把需要的信息提取出来啦~
大功告成~

Echo__Lin

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
curl ——爬网页数据

初级 curl 爬网页数据
复制链接

扫一扫

专栏目录

curl ——爬网页数据

“相关推荐”对你有帮助么？