Scrapy模拟登录小记

Scrapy登录方式

  • 方式一:直接携带cookie
  • 方式二:找到发送post请求的URL地址,带上信息,发送请求

人人练习

创建爬虫项目

scrapy startproject renren

renrenlogin.py

# -*- coding: utf-8 -*-
import scrapy

from ..settings import DEFAULT_REQUEST_HEADERS

class RenrenloginSpider(scrapy.Spider):
    name = 'renrenlogin'
    allowed_domains = ['renren.com']
    start_urls = ['http://www.renren.com/269782969/profile']

    #重写父类的方法
    def start_requests(self):

        str_cookies = '{}'.format(cookies字符串)

        cookies = {}
        for i in str_cookies.split(';'):
            # print(i)
            # print(i.split('=')[0])
            # print(i.split('=')[1])
            cookies[i.split('=')[0]] = i.split('=')[1]
        #print(DEFAULT_REQUEST_HEADERS)
        #print(self.start_urls[0])
        print(cookies)
        yield scrapy.Request(
            url=self.start_urls[0],
            headers=DEFAULT_REQUEST_HEADERS,
            cookies = cookies,
            callback=self.parse
        )

    def parse(self, response):

        #print(response.text)
        with open('renren.html', 'w', encoding='utf-8') as f:
            f.write(response.body.decode())


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Narutolxy

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值