使用Scrapy-Splash实现淘宝免密登录

本文介绍了如何使用Scrapy-Splash来绕过淘宝的反爬机制,通过预先获取cookies并存储,然后在爬虫中读取cookies进行免密登录爬取。核心代码包括设置start_requests读取本地cookies,构造 SplashRequest 并传入LUA脚本。相较于Scrapy对接Selenium,Scrapy-Splash能提高爬取速度,但频繁爬取可能引发封禁,建议配合代理和cookies池使用。
摘要由CSDN通过智能技术生成

使用Scrapy-Splash实现淘宝免密登录:

众所周知,淘宝的反爬能力较强,笔者试过屏蔽浏览器webdriver但效果不佳,因此另辟蹊径采取cookies免密登录爬取淘宝信息。

创建爬虫后核心代码如下:

    def get_cookies(self,fp):
        with open(fp,"r") as f:
            cookies = json.load(f)
        for cookie in cookies:
            if "expiry" in cookie.keys():
                cookie.pop("expiry")
        return cookies

	def start_requests(self)
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值