反爬虫之修改爬虫的时间间断

最新推荐文章于 2023-11-29 01:35:07 发布

叹！

最新推荐文章于 2023-11-29 01:35:07 发布

阅读量560

点赞数 1

分类专栏：爬虫文章标签：爬虫 python 开发语言

本文链接：https://blog.csdn.net/qq_44721518/article/details/124966313

版权

频繁的浏览不符合正常用户的行为，故可以让爬虫间断性休息

import requests
from bs4 import BeautifulSoup
import time
import random

link = "http://www.santostang.com/"

def scrap(link):
    headers = {
   
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.100 Safari/537.36'
    }
    r = requests.get(link,headers = headers)
    soup = BeautifulSoup(r.text,"lxml")
    return soup
soup = scrap(link)
title_list = soup.find_all("h1",class_<

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

叹！

关注关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
反爬虫之修改爬虫的时间间断

频繁的浏览不符合正常用户的行为，故可以让爬虫间断性休息import requestsfrom bs4 import BeautifulSoupimport timeimport randomlink = "http://www.santostang.com/"def scrap(link): headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML
复制链接

扫一扫