scraoy 反爬方法

本文介绍了使用Scrapy进行网络爬取时的反爬策略,包括User-Agent池、IP池、禁用Cookie、下载延迟以及模拟登录等方法,旨在提升爬虫的隐蔽性和效率。
摘要由CSDN通过智能技术生成

1.User-Agen池

2.IP池

3.禁用COOKIE

settings.py
COOKIES_ENABLED = False

 

4.下载延迟

#settings.py
DOWNLOAD_DELAY = 3

5.模拟登陆

Scrapy.FromRequest方法

 

#爬虫文件
# -*- coding: utf-8 -*-
import scrapy


class Sun2Spider(scrapy.Spider):
    name = 'Sun2'
    allowed_domains = ['sun0769.com']
    #登录之后的个人主页
    start_urls = ['http://sun0769.com/']
    strcookies = 'uuid_tt_dd=10_23426688290-1581387665112-721872; dc_session_id=10_1581387665112.225774; searchHistoryArray=%255B%2522Kworky%2522%252C%2522Kwoky%2522%255D; UserName=m0_38055579; UserInfo=57c3962a9b0042e285cb3e108c4b285e; UserToken=57c3962a9b0042e285cb3e108c4b285e; UserNick=%E5%A4%A9%E5%AE%87%E6%8A%80%E5%B8%88; AU=115; UN=m0_38055579; BT=1
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值