【Python】【爬虫】requests+lxml模拟登录爬取信息

最新推荐文章于 2023-10-13 19:54:06 发布

little_stupid_child

最新推荐文章于 2023-10-13 19:54:06 发布

阅读量1.6k

点赞数 1

分类专栏： Python 爬虫文章标签： python requests lxml 模拟登陆爬虫

本文链接：https://blog.csdn.net/little_stupid_child/article/details/80346980

版权

Python 同时被 2 个专栏收录

12 篇文章 0 订阅

订阅专栏

爬虫

1 篇文章 0 订阅

订阅专栏

要求：通过爬虫技术，模拟用户登录龙池网站，爬取用户的相关信息（昨日算力，昨日收益）

问题：龙池的网站需要滑动解锁才可登录

一.模拟登录

1.使用会话访问主页，抓取主页中的token

import requests
from lxml import etree

s = requests.Session()
r = s.get("https://www.dpool.top/index")
html = etree.HTML(r.text)
node = html.xpath('//*[@id="forgetPwd"]/div/div[2]/form/input[1]')[0]
token = node.get('value')

注意：token是动态变化的，每次登录时都需要抓取

2.配置参数、首部，模拟登录

r = s.post("https://www.dpool.top/pools/login", headers = {'X-CSRF-TOKEN':token, 'Referer':'https://www.dpool.top/index'}
, params = {'email':'***********@163.com', 'password':'********'})

注意：如果不在headers添加token，r.status_code会打印500错误

二.获取数据并解析

r = s.get("https://www.dpool.top/pools/ajax-worker-stats", headers = {'Referer':'https://www.dpool.top/pools/dashboard'})
value = r.json()['shares_24h']
print value, "T/S"

r = s.get("https://www.dpool.top/pools/subaccount-list/?curr=1&nums=10", headers = {'Referer':'https://www.dpool.top/pools/subaccount'})
value = r.json()['data'][1]['profit']
print value

获得的数据为josn结构，可以通过response的json（）函数直接提取

`三.打印结果`

<--dpool_BTC-->liang_06
91.34 T/S
0.00543674

little_stupid_child

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【Python】【爬虫】requests+lxml模拟登录爬取信息

要求：通过爬虫技术，模拟用户登录龙池网站，爬取用户的相关信息（昨日算力，昨日收益）问题：龙池的网站需要滑动解锁才可登录一.模拟登录1.使用会话访问主页，抓取主页中的tokenimport requestsfrom lxml import etrees = requests.Session()r = s.get("https://www.dpool.top/index")html = et...
复制链接

扫一扫

专栏目录