cookie模拟登陆

最新推荐文章于 2025-03-28 13:05:41 发布

狂大炮

最新推荐文章于 2025-03-28 13:05:41 发布

阅读量1.1k

点赞数

本文介绍如何使用Scrapy框架通过预设的Cookie进行网站登录，实现对特定用户页面的爬取。示例代码展示了从定义Spider类到设置Cookie，再到解析页面返回内容的完整流程。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

import scrapy

class LoginByCookie(scrapy.Spider):
"""
直接使用cookie登录
"""

name = 'login_by_cookie'
allowed_domains=['www.imooc.com']
start_urls=[]

def start_requests(self):
"""重写start_requests()方法"""

home_url='https://www.imooc.com/u/2346025'
login_cookie={'imooc_uuid':'c13c8cb7-442a-430e-a2c1-78d91c347b67',
'imooc_isnew_ct':'1515076153',
'imooc_isnew':'2',
'loginstate':'1',
'apsid':'NhMDY2ZDFmODhmYWQ5ZmQ2NDI3ZDg0OTU0NWM3NTQAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAMjM0NjAyNQAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA4MDkwMjE4MjNAcXEuY29tAAAAAAAAAAAAAAAAAAAAAGI3ZmJjOTUxMTU2YjBlOTVlOTIxYzM1ZDk0OTVmOGNhW3FQWltxUFo%3DYm',
'PHPSESSID':'vd48nsltdovbbifsn48pu15763',
'IMCDNS':'0',
'Hm_lvt_f0cfcccd7b1393990c78efdeebff3968':'1515076155,1515221269,1515746784,1516641134',
'Hm_lpvt_f0cfcccd7b1393990c78efdeebff3968':'1516641134',
'cvde':'5a661b6d0246d-3'
}

yield scrapy.FormRequest(
url=home_url,cookies=login_cookie,callback=self.parse_page)

def parse_page(self,response):
print(response.body.decode('utf-8'))
print(response.xpath('//title/text()').extract_first())