python模拟app登陆_python scrapy版 模拟登陆appAnnie

本文档展示了一个使用Python Scrapy框架编写爬虫的实例,主要目的是登录'appannie.com'网站并抓取特定页面的数据。首先,通过正则表达式获取登录所需的CSRF Token,然后使用FormRequest进行登录操作。登录成功后,进一步请求目标页面,提取并打印出所需的内容。这个案例涉及到网页登录、数据解析和网页请求等关键步骤。
摘要由CSDN通过智能技术生成

方法总比困难多,遇到问题,要找到问题的根源,不断地调试,不要放弃,一定会与解决的方法,程序是人写的,问题不可能没有办法解决,冷静的去分析,问题一定会解开的,加油!

# -*- coding: utf-8 -*-

import scrapy

import re

class AppannieSpider(scrapy.Spider):

name = 'appannie'

# allowed_domains = ['appannie.com']

start_urls = ['https://www.appannie.com/account/login/?_ref=header']

def parse(self, response):

BodyHtml = response.body.decode()

getToken = re.search(r"", BodyHtml)

Real_Token = getToken.group(1)

print(Real_Token)

yield scrapy.FormRequest(

url='https://www.appannie.com/account/login',

headers={

'X-Requested-With': 'XMLHttpRequest',

'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_12_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/71.0.3578.98 Safari/537.36',

},

formdata={

'csrfmiddlewaretoken': Real_Token,

'next': '/dashboard/home/',

'username': '你的账号',

'password': '你的密码'

},

callback=self.after_login

)

def after_login(self, response):

url = 'https://www.appannie.com/ajax/top-chart/table/?market=google-play&country_code=US&category=1&date=2018-12-26&rank_sorting_type=rank&page_size=100&order_type=desc'

return scrapy.Request(url, headers={'X-Requested-With': 'XMLHttpRequest','User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_12_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/71.0.3578.98 Safari/537.36',}, callback=self.get_content)

def get_content(self, response):

Result = response.body.decode()

getContent = re.findall(r'/apps/google-play/app/(.*?)/', Result)

print(getContent)

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值