python模拟app登陆_python scrapy版模拟登陆appAnnie

最新推荐文章于 2024-05-12 15:00:00 发布

weixin_39875192

最新推荐文章于 2024-05-12 15:00:00 发布

阅读量609

点赞数

文章标签： python模拟app登陆

本文档展示了一个使用Python Scrapy框架编写爬虫的实例，主要目的是登录'appannie.com'网站并抓取特定页面的数据。首先，通过正则表达式获取登录所需的CSRF Token，然后使用FormRequest进行登录操作。登录成功后，进一步请求目标页面，提取并打印出所需的内容。这个案例涉及到网页登录、数据解析和网页请求等关键步骤。

摘要由CSDN通过智能技术生成

方法总比困难多,遇到问题,要找到问题的根源,不断地调试,不要放弃,一定会与解决的方法,程序是人写的,问题不可能没有办法解决，冷静的去分析,问题一定会解开的，加油!

# -*- coding: utf-8 -*-

import scrapy

import re

class AppannieSpider(scrapy.Spider):

name = 'appannie'

# allowed_domains = ['appannie.com']

start_urls = ['https://www.appannie.com/account/login/?_ref=header']

def parse(self, response):

BodyHtml = response.body.decode()

getToken = re.search(r"", BodyHtml)

Real_Token = getToken.group(1)

print(Real_Token)

yield scrapy.FormRequest(

url='https://www.appannie.com/account/login',

headers={

'X-Requested-With': 'XMLHttpRequest',

'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_12_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/71.0.3578.98 Safari/537.36',

formdata={

'csrfmiddlewaretoken': Real_Token,

'next': '/dashboard/home/',

'username': '你的账号',

'password': '你的密码'

callback=self.after_login

)

def after_login(self, response):

url = 'https://www.appannie.com/ajax/top-chart/table/?market=google-play&country_code=US&category=1&date=2018-12-26&rank_sorting_type=rank&page_size=100&order_type=desc'

return scrapy.Request(url, headers={'X-Requested-With': 'XMLHttpRequest','User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_12_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/71.0.3578.98 Safari/537.36',}, callback=self.get_content)

def get_content(self, response):

Result = response.body.decode()

getContent = re.findall(r'/apps/google-play/app/(.*?)/', Result)

print(getContent)

weixin_39875192

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
python模拟app登陆_python scrapy版模拟登陆appAnnie

方法总比困难多,遇到问题,要找到问题的根源,不断地调试,不要放弃,一定会与解决的方法,程序是人写的,问题不可能没有办法解决，冷静的去分析,问题一定会解开的，加油!# -*- coding: utf-8 -*-import scrapyimport reclass AppannieSpider(scrapy.Spider):name = 'appannie'# allowed_domains = [...
复制链接

扫一扫