涉及详情页的信息爬取

最新推荐文章于 2024-04-30 22:59:39 发布

ConverseSuger

最新推荐文章于 2024-04-30 22:59:39 发布

阅读量709

点赞数

分类专栏： python爬虫

本文链接：https://blog.csdn.net/dic_converse/article/details/52938991

版权

本文介绍了如何构建Func A和Func B两个函数，Func A专注于抓取网页详情页的标题、副标题和图片等关键数据，而Func B则用于获取列表页的链接，通过遍历Func B获取的链接，实现对详情页信息的全面爬取。

摘要由CSDN通过智能技术生成

构建两个函数，Func A 用来抓取详情页的数据，例如标题，副标题，图片等，Func B 用来抓取列表页的链接，依次访问Func B函数所抓取的链接即可。

from bs4 import BeautifulSoup
import requests
import time

def get_info(page):
    urls=get_links_from(page)   #调用获取链接函数，并利用循环依次访问
    for url in urls:
        web_data=requests.get(url)
        soup=BeautifulSoup(web_data.text,'lxml')

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

ConverseSuger

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
涉及详情页的信息爬取

构建两个函数，Func A 用来抓取详情页的数据，例如标题，副标题，图片等，Func B 用来抓取列表页的链接，依次访问Func B函数所抓取的链接即可。from bs4 import BeautifulSoupimport requestsimport timedef get_info(page): urls=get_links_from(page) #调用获
复制链接

扫一扫