爬虫实战之爬取百度贴吧

最新推荐文章于 2024-04-18 19:37:40 发布

VIP文章 print-null

最新推荐文章于 2024-04-18 19:37:40 发布

阅读量490

点赞数 1

分类专栏：爬虫实战专栏文章标签： pycharm python ide

本文链接：https://blog.csdn.net/m0_62036306/article/details/121444190

版权

今天的爬虫实战是爬取百度贴吧
爬虫五部曲，目标链接，分析网页，发起请求，解析，保存
在这里插入图片描述
kw后面就是我们输入要进入的贴吧，pn就是翻页的值

在这里我们本次目的是把整个网页拿下来，我们就不用xpath了
直接上菜

from urllib import request,parse
import time
import random
#创建类
class Baidutieba(object):

    def __init__(self):
        '''基本常量'''
        self.url = "https://tieba.baidu.com/f?kw={}&pn={}"
        self.headers

最低0.47元/天解锁文章

优惠劵

print-null

关注关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
打赏
0
评论
爬虫实战之爬取百度贴吧

今天的爬虫实战是爬取百度贴吧爬虫五部曲，目标链接，分析网页，发起请求，解析，保存kw后面就是我们输入要进入的贴吧，pn就是翻页的值在这里我们本次目的是把整个网页拿下来，我们就不用xpath了直接上菜from urllib import request,parseimport timeimport random#创建类class Baidutieba(object): def __init__(self): '''基本常量''' self.url
复制链接

扫一扫